Está en la página 1de 9

INTRODUCCION

Los métodos no paramétricos permiten estudiar la estrutura probabilística de la


población a partir de información muestral (ver Silvernan, 1986, Delgado y
Robinson, 1992 y Cao et al., 1997). En el contexto del análisis de la distribución de
la renta, a partir de los resultados de la estimación núcleo de la función de
densidad, Cao et al. (1997) concluyen que la distribución lognormal "is not suitable
for representing the income family distribution".

En este trabajo se analizan las rentas laborales que se recogen en la Encuesta de


Presupuestos Familiares Española para el año 1990 (EPF90) y se utiliza la
estimación núcleo de la función de densidad para el análisis de su distribución.
Los resultados que aquí se presentan muestran cómo la función de densidad se
aleja de las que comúnmente se han utilizado en este contexto (lognormal,
gamma, etc.).

Para superar la dificultad de estimación de densidades muy asimétricas, utilizamos


un procedimiento de transformación que permite mejores ajustes globales (ver,
Wand et al., 1991; Bolancé, Guillén, Nielsen , 2000). Para seleccionar la
transformación adecuada se implementa la metodología que con este propósito se
describe en Bolancé (1999), con la que se obtienen resultados más eficientes.

1
ESTIMACIÓN POR MÉTODOS NO PARAMÉTRICOS

Es la matriz de covarianza de los errores, ésta debe ser no singular y definida


positiva. Así, es posible encontrar mediante factorización Cholesky una matriz
triangular S, tal que Σ = SSt. Sustituyendo esta expresión en la expresión y
desarrollando, se obtiene que:

es decir, que ahora se realiza la regresión sobre las nuevas variables Y 0 y X0 . Es


fácil ver que los nuevos errores e 0= Y0− X0 β son incorrelacionados y de varianza
constante:

De esta manera, la factorización Cholesky resulta de interés en el caso de


estimación bajo dependencia espacial porque permite hacer una transformación
de los datos originales a datos independientes, como quedó demostrado en
(2.2.5). Esto será de mucha utilidad más adelante para los propósitos de este
trabajo.

Las técnicas estadísticas de estimación de parámetros, intervalos de confianza y


prueba de hipótesis son, en conjunto, denominadas ESTADÍSTICA
PARAMÉTRICA y son aplicadas básicamente a variables contínuas. Estas

2
técnicas se basan en especificar una forma de distribución de la variable aleatoria
y de los estadísticos derivados de los datos.

En un gran número de casos no se puede determinar la distribución original ni la


distribución de los estadísticos por lo que en realidad no tenemos parámetros a
estimar. Tenemos solo distribuciones que comparar. Esto se llama ESTADÍSTICA
NO -PARAMÉTRICA.

El estimador no paramétrico de la tendencia consiste en una generalización de la


estimación de la tendencia en un punto x considerando un promedio ponderado de
las respuestas Y, dando mayor peso a las respuestas cercanas y menor peso a
las lejanas. El estimador no paramétrico a utilizar en este trabajo es el llamado
local lineal. Este estimador es una generalización del estimador de Nadaraya-
Watson.

Estimador local lineal

Considerando por simplicidad el caso unidmensional, la estimación de la tendencia


mˆ (x) en un punto x, se calcula por medio de un promedio ponderado de las
observaciones Yi

3
Asimismo, K es una función núcleo, simétrica y definida positiva, y h es una
ventana de suavización que determina el tamaño del vecindario para realizar la
respuesta media. La función núcleo actúa como una función de peso que le otorga
mayor importancia a los puntos cercanos y menor importancia a los puntos
alejados de x.

La función K debe cumplir las siguientes propiedades:

K(x) ≥ 0 para todo x.

´ K(t)dt=1

K(−x) = K(x)

Hay varias funciones que se pueden considerar como núcleo. Algunas de ellas
son:

4
MÉTODO POR ANALOGÍA. Consiste en aplicar la misma expresión formal del
parámetro poblacional a la muestra, generalmente, estos estimadores son de
cómoda operatividad, pero en ocasiones presentan sesgos y no resultan
eficientes. Son recomendables, para muestras de tamaño grande al cumplir por
ello propiedades asintóticas de consistencia.

METODO DE LOS MOMENTOS. Consiste en tomar como estimadores de los


momentos de la población a los momentos de la muestra. Podríamos decir que es
un caso particular del método de analogía. En términos operativos consiste en
resolver el sistema de equivalencias entre unos adecuados momentos
empíricos(muestrales) y teóricos(poblacionales).

Ejemplo:

5
Conocemos que la media poblacional de una determinada variable x depende de
un parámetro K que es el que realmente queremos conocer (estimar). Así:

ESTIMADORES MAXIMO-VEROSIMILES. La verosimilitud consiste en otorgar a


un estimador/estimación una determinada "credibilidad" una mayor apariencia de
ser el cierto valor(estimación) o el cierto camino para conseguirlo(estimador).

En términos probabilísticos podríamos hablar de que la verosimilitud es la


probabilidad de que ocurra o se dé una determinada muestra si es cierta la
estimación que hemos efectuado o el estimador que hemos planteado.

Evidentemente, la máxima verosimilitud, será aquel estimador o estimación que


nos arroja mayor credibilidad. En situación formal tendríamos: Un estimador
máximo-verosímil es el que se obtiene maximizando la función de verosimilitud
(likelihood) de la muestra

Pruebas no Paramétricas

Vamos a ver algunas de las pruebas no paramétricas, las cuales no requieren


asumir normalidad de la población y que en su mayoría se basan en el
ordenamiento de los datos. Todas las pruebas que veremos requieren que la
población sea continua. El parámetro que se usa para hacer las pruebas
estadísticas es la Mediana y no la Media y no la Media.

Prueba de los Signos

Se usa para hacer pruebas de hipótesis acerca de la mediana de una población.

6
Ho: La Mediana poblacional es igual a un valor dado.
Ha: La mediana es menor (mayor ó distinta) del valor dado.

La prueba estadística está basada en la distribución Binomial con probabilidad de


éxito p=½, puesto que la probabilidad de que un dato sea mayor o menor que la
mediana es ½.

Para calcularla se determinan las diferencias de los datos con respecto al valor
dado de la mediana y se cuentan los signos positivos y negativos.

Si la hipótesis alterna es "menor que" y el número de diferencias positivas es


mayor que el número de diferencias negativas entonces “valor-p ” = P 2 en caso
contrario “valor-p” = P1. Cuando la hipótesis alterna es de dos lados y el número
de diferencias positivas son mayores que el número de diferencias negativas
entonces el “valor-p ” = 2 P 2, si hay menor número de diferencias positivas
entonces “valor-p”=2 P1 y si hay igual número de diferencias positivas y negativas
entonces, “valor-p”=1.

Si n>20 se puede usar aproximación Normal a una Binomial con p = q = 0.5, para
calcular los “valores-p”. Es decir,

Prueba de Rangos con signos de Wilcoxon

Es usada para hacer pruebas de hipótesis acerca de la mediana. La prueba


estadística se basa en el estadístico de Wilcoxon (1945), el cual se calcula de la
siguiente manera:

7
Se resta de cada dato el valor de la mediana que se considera en la hipótesis
nula.

Se calcula los rangos de las diferencias sin tomar en cuenta el signo de las
mismas (o sea en valor absoluto). En el caso de haber empate se asigna un rango
promedio a todas las diferencias empatadas es decir; se les asigna el rango:

8
BIBLIOGRAFÍA

1. Https://www.uv.es/ceaces/tex1t/4%20estimacion/metodos.htm
2. L. Wasserman. All of Nonparametric Statistics. New York. Springer.
3. M.A. Diaz Viera. “Geoestadística Aplicada”. Notas de curso. Instituto de
Geofísica, Universidad Nacional Autónoma de México (UNAM). Instituto de
Geofísica y Astronomía, CITMA. Cuba. 2002.
4. 98

También podría gustarte