Está en la página 1de 7

1.

1.1.
1.2.
1.3.
1.4.
1.5.
1.6. Terminología y notación:
Se utiliza la terminología de "variable dependiente/variable explicativa" o
"regresada y regresora". Cuando se estudia la relación entre una variable y una
única variable explicativa, se llama análisis de regresión simple o con dos
variables. Por ejemplo, si se analiza cómo el consumo depende del ingreso real.
Por otro lado, si se estudia la dependencia de una variable con respecto a
múltiples variables explicativas, como el rendimiento de un cultivo con la
lluvia, la temperatura, el sol y los fertilizantes, se trata de un análisis de
regresión múltiple. En resumen, en la regresión simple hay una sola variable
explicativa, mientras que en la regresión múltiple hay más de una variable
explicativa.
Además, el término "aleatorio" se usa como sinónimo de "estocástico". Una
variable aleatoria o estocástica puede tomar cualquier conjunto de valores, ya
sean positivos o negativos, con una probabilidad asignada a cada valor.
Ahora bien, expliquemos la terminología:

Y Representa la variable dependiente.


X Variables explicativas.
Xk La k-ésima variable explicativa.
Son subíndices que denotar la observación o valor i-ésimo, t-ésimo de la
i, t variable X k.
i, se utiliza para datos transversales y t, para datos de series de tiempo.
N Representa el número total de observaciones o valores en la población.
n Es el número de observaciones en una muestra.

1.7. Naturaleza y fuentes de datos para el análisis económico:


El éxito de todo análisis econométrico depende de la disponibilidad de los datos
recopilados. Es por esto, que es muy importante dedicar una parte del tiempo a
estudiar la naturaleza, las fuentes y las limitaciones de los datos para el análisis
empírico.
1.7.1.1. Tipos de datos:
Existen tres tipos de datos disponibles para el análisis empírico: Series
de tiempo, series transversales e información combinada.
1.7.1.1.1.1. Datos de Series de tiempo:
Estos datos se recopilan en intervalos regulares, como
diariamente, semanalmente, mensualmente,
trimestralmente, anualmente o a intervalos más largos. En
algunos casos, los datos están disponibles tanto trimestral
como anualmente, como en el caso del PIB y el consumo.
Gracias a las computadoras de alta velocidad, ahora
también se recopilan datos en intervalos muy cortos, como
los precios de las acciones en tiempo real. Aunque los datos
de series de tiempo se utilizan ampliamente en estudios
econométricos, presentan desafíos particulares. Para
analizarlos, se asume que las series son estacionarias, lo
cual implica que su media y varianza no varían
sistemáticamente con el tiempo. En resumen, la
estacionariedad es una propiedad clave de las series de
tiempo que se abordará en capítulos posteriores sobre
econometría de series de tiempo.
1.7.1.1.1.2. Datos transversales:
Cuando se incluyen unidades heterogéneas en un análisis
estadístico, debe tenerse presente el efecto de tamaño o de
escala con el fin de no mezclar manzanas con naranjas.
1.7.1.1.1.3. Datos combinados:
Los datos combinados reúnen elementos de series de
tiempo y transversales.
1.7.1.1.1.4. Datos en panel longitudinales o en micropanel:
Existen datos especiales llamados datos en panel, en los
que se analiza una misma unidad a lo largo del tiempo. Por
ejemplo, el Departamento de Comercio de Estados Unidos
realiza encuestas periódicas a familias específicas para
conocer si ha habido cambios en sus condiciones de
vivienda o situación financiera desde la última encuesta.
Estos datos en panel brindan información valiosa sobre
cómo se comportan las familias a lo largo del tiempo.
Los datos en panel nos permiten estudiar la evolución y
dinámica de las unidades familiares a lo largo del tiempo.
Ahora bien, supongamos que se entrevista a un grupo de
empresas, por supuesto individualmente, pero parte de la
misma investigación. Si el número de observaciones es
igual en cada una de las empresas, se conoce como panel
balanceado. Si el número de observaciones no es igual en
cada empresa, se le conoce como panel desbalanceado.
1.7.1.2. Fuentes de datos:
Los datos a utilizar para el análisis empírico suelen provenir de una
dependencia gubernamental, un organismo internacional, una
organización privada o particular. Existen miles de fuentes de datos,
para los distintos objetivos que se deseen cumplir.
1.7.1.2.1.1. Internet:
La llegada de Internet ha transformado la recopilación de
datos. Ahora es posible obtener una amplia gama de fuentes
de información al realizar búsquedas en los motores de
búsqueda utilizando palabras clave o frases.
Los datos recopilados por las distintas organizaciones o
páginas que se encuentran en la web, pueden ser de
naturaleza experimental o no experimental. En las ciencias
naturales, es común utilizar datos experimentales, donde el
investigador controla ciertos factores para evaluar su efecto
en un fenómeno específico. Por otro lado, en las ciencias
sociales, los datos suelen ser no experimentales, lo que
significa que no están sujetos al control directo del
investigador.
1.7.1.3. Precisión de los datos:
Si bien es cierto, se cuenta con una infinitud de datos para la
investigación, sin embargo cantidad no significa calidad, esto debido
a distintas razones.
1. Como hemos discutido anteriormente, la mayoría de los datos
en las ciencias sociales son de naturaleza no experimental.
Esto significa que existe la posibilidad de cometer errores de
observación, ya sea por acciones incorrectas o por omisiones.
2. Incluso en los datos recolectados de manera experimental,
pueden surgir errores de medición debido a aproximaciones o
redondeos.
3. En las encuestas realizadas mediante cuestionarios, el
problema de la falta de respuesta puede ser significativo. Un
investigador puede considerarse afortunado si logra obtener
una tasa de respuesta del 40%. Sin embargo, el análisis basado
en esta tasa parcial de respuesta puede no reflejar
adecuadamente el comportamiento del 60% de los encuestados
que no respondieron, lo que puede generar un sesgo de
selección en la muestra. Además, existe el problema de
aquellos que responden el cuestionario, pero omiten algunas
preguntas, especialmente aquellas relacionadas con cuestiones
financieras delicadas, lo que genera un sesgo adicional.
4. Debido a que existen diferentes métodos de muestreo
utilizados para obtener datos, a menudo resulta difícil
comparar los resultados de diferentes muestras.
5. Frecuentemente, las cifras económicas se encuentran
disponibles en niveles de agregación muy altos. Los datos a
niveles tan agregados pueden no ofrecer información
suficiente sobre las características y particularidades de los
elementos individuales que conforman la economía o la región
analizada.
6. Debido a consideraciones de confidencialidad, algunos datos
están sujetos a restricciones y solo pueden ser publicados en
forma altamente agregada. Por ejemplo, en Estados Unidos, la
ley prohíbe al Servicio de Impuestos Internos (IRS) revelar
información detallada de las declaraciones de impuestos
individuales y solo se pueden divulgar datos generales. Esto
significa que, si se desea conocer el gasto en salud de personas
con determinado nivel de ingresos, solo se puede obtener
información en un nivel muy agregado. Sin embargo, estos
análisis a nivel macro a menudo resultan insuficientes para
comprender la dinámica del comportamiento de las unidades
individuales.

Dada la variedad de problemas asociados con la recopilación de


datos, el investigador debe ser consciente de que la calidad de los
datos es fundamental para obtener resultados satisfactorios en la
investigación. En ocasiones, si los investigadores consideran que
los resultados de su estudio son insatisfactorios, la causa puede
estar en la mala calidad de los datos en lugar de un modelo
incorrecto. Lamentablemente, debido a la naturaleza no
experimental de la mayoría de los estudios en ciencias sociales,
los investigadores a menudo se ven limitados a utilizar la
información disponible. Sin embargo, es importante recordar que
los datos pueden tener limitaciones y los investigadores deben
evitar ser demasiado dogmáticos en cuanto a los resultados de un
estudio específico, especialmente cuando la calidad de los datos
no es confiable.

1.7.1.4. Una observación sobre las escalas de medición de las variables:


Las variables que a menudo encontrará se clasifican en cuatro
categorías generales: escala de razón, escala de intervalo, escala
ordinal y escala nominal.
1.7.1.4.1.1. Escala de razón:
Para la variable X, al momento de tomar dos valores (
X 1 y X 2), la razón X 1 / X 2 y la distancia ( X 2−X 1 ) son
cantidades con un significado. Así mismo, hay un
ordenamiento natural de los valores a lo largo de la escala.
Siguiendo lo anterior, las comparaciones como X 2 ≤ X 1o
X 2 ≥ X 1son sensatas. La mayoría de las variables
económicas pertenecen a esta categoría.
1.7.1.4.1.2. Escala de intervalo:
Una variable en escala de intervalo cumple con las dos
últimas características de una variable en escala de razón,
pero no con la primera. Esto significa que la diferencia
entre dos puntos en el tiempo, como los años 2000 y 1995,
tiene un significado, pero la relación entre dos puntos,
como 2000/1995, carece de sentido.
1.7.1.4.1.3. Escala ordinal:
Una variable pertenece a esta categoría solo si cumple con
la tercera propiedad de la escala de razón, que implica un
orden natural. Ejemplos de estas variables son los sistemas
de calificación por letras (A, B, C) o los niveles de ingresos
alto, medio y bajo. En estas variables, existe un orden, pero
las distancias entre las categorías no son cuantificables.
Un ejemplo relacionado que los estudiantes de economía
pueden recordar son las curvas de indiferencia entre dos
bienes. En este caso, una curva de indiferencia superior
indica un mayor nivel de utilidad, pero no se puede
cuantificar exactamente cuánto mayor es una curva de
indiferencia en comparación con otra.
1.7.1.4.1.4. Escala nominal:
Las variables de esta categoría, como el género (masculino
y femenino) y el estado civil (casado, soltero, divorciado,
separado), no poseen ninguna de las características de las
variables en escala de razón. Estas variables simplemente
representan categorías y no se pueden medir en términos de
orden, distancia o proporción.
La razón por la cual no se pueden expresar estas variables
con escalas de razón, intervalo u orden es que no tienen una
naturaleza cuantitativa que permita realizar operaciones
matemáticas significativas. No tiene sentido asignar
números o realizar cálculos de proporción en relación a
estas categorías.
En el campo de la econometría, las técnicas adecuadas para
las variables en escala de razón no serían pertinentes para
las variables en escala nominal. Es importante tener en
cuenta las diferencias entre los cuatro tipos de escalas de
medición que hemos analizado, ya que cada una tiene
características distintas y requiere enfoques diferentes en el
análisis de datos.

También podría gustarte