Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Algunas veces, por las características del estimador utilizado, conforme el tamaño de la muestra
aumenta el error aumenta también. Ese estimador no sería deseable utilizarlo. Ahora bien, a priori,
no sabemos hacia dónde tiende el sesgo. Si tiende a cero, tiende a cierto valor o tiende a infinito
cuando el tamaño de la muestra se hace más grande.
Dicho esto, se hace necesario definir el concepto de consistencia. Para ellos, hemos de decir que
existen dos tipos de consistencia. Por un lado, existe la consistencia simple. Mientras que, por otra
parte, se encuentra la consistencia en media cuadrática.
Por decirlo de alguna manera, son dos herramientas matemáticas que nos permiten calcular hacia
qué número o números converge nuestro estimador.
Estimación puntual
Consistencia simple
Se entiende que el valor del error notado por épsilon, debe ser mayor que cero.
Intuitivamente, la fórmula indica que cuando el tamaño de la muestra se hace muy grande, la
probabilidad de que exista un error mayor que cero es cero. Dicho de forma inversa, la probabilidad
de que no exista error cuando el tamaño de la muestra es muy grande es, hablando en
probabilidades, de prácticamente el 100%.
Otra herramienta que se puede utilizar para comprobar que un estimador es consistente es el error
cuadrático medio. Esta herramienta matemática es aún más potente que la anterior. La razón es que
la exigencia de esta condición es mayor.
Es decir, que cuando el tamaño de muestra sea grande, la esperanza matemática de los errores al
cuadrado sea cero. La única opción de que este valor sea cero, es que el error siempre valga cero.
¿Por qué? Porque al estar elevado a dos el error de estimación (Estimador – Valor verdadero del
parámetro), el resultado siempre va a ser positivo. A menos, eso sí que el error sea cero. Cero
elevado a dos es cero.
Claro está que, si el límite da como resultado 0,0001, podemos asumir que es igual a cero. Es casi
imposible que la aplicación del error en media cuadrática salga cero.
Los métodos de imputación consisten en estimar los valores ausentes en base a los valores
válidos de otras variables y/o casos de la muestra. La estimación se puede hacer a partir
de la información del conjunto completo de variables o bien de algunas variables
especialmente seleccionadas. Usualmente los métodos de imputación se utilizan con
variables métricas (de intervalo o de razón), y deben aplicarse con gran precaución
porque pueden introducir relaciones inexistentes en los datos realas
El código “.” que comúnmente se asocia con información faltante, se debe reservar para
situaciones en que no fue posible recabar datos, mientras que el dígito “0” (cero) se preserva para
variables (discretas o continuas) que puedan asumir ese valor, y por tanto no se aconseja asignarlo
a registros sin información.8
Existen también las variables latentes que están relacionadas con missing data. Este tipo de
variables son cantidades que no se pueden observar, y en el trabajo empírico sólo se puede lograr
una medición imperfecta de ellas; por ejemplo, la medición de inteligencia o la asertividad de las
personas.11 Un aspecto crucial en el análisis de datos se vincula al porcentaje máximo de
omisiones que deben aceptarse. No existen criterios objetivos para dilucidar este tema, por lo que
cada investigador debe hacerse cargo de sus propias decisione