Está en la página 1de 27

Capítulo 11

PRUEBAS ESTADÍSTICAS BASADAS


EN PUNTUACIONES DE EFICIENCIA
DE LA DEA

Rajiv D. Banker1 y Ram Natarajan2


School of Management, The University of Texas at Dallas, Richardson, TX 75083-0688
CorreoEE. UU . electrónico de: 1 rbanker@utdallas.edu 2nataraj@utdallas.edu
Resumen: Este capítulo está escrito para analistas e investigadores que pueden utilizar el
Análisis envolvente de datos (DEA) para evaluar estadísticamente hipótesis sobre las
características de las correspondencias de producción y los factores que afectan la
productividad. Contrariamente a algunas caracterizaciones, se muestra que DEA es una
metodología estadística en toda regla, basada en la caracterización de la eficiencia de DMU
como variable estocástica. El estimador DEA de la frontera de producción tiene propiedades
estadísticas deseables y proporciona una base para la construcción de una amplia gama de
pruebas estadísticas formales (Banker 1993). Las pruebas específicas descritas aquí abordan
cuestiones tales como comparaciones de eficiencia de grupos de DMU, existencia de
economías de escala, existencia de ineficiencia asignativa, separabilidad y sustituibilidad de
insumos en los sistemas de producción, análisis de cambio técnico y cambio de productividad,
impacto de variables contextuales en la productividad y la adecuación de las formas
funcionales paramétricas para estimar funciones de producción monótonas y cóncavas.

Palabras clave: Análisis envolvente de datos (DEA); Pruebas estadísticas

1. INTRODUCCIÓN
El análisis envolvente de datos (DEA) sigue utilizándose ampliamente en
muchos entornos para analizar los factores que influyen en la eficiencia de las
organizaciones. El enfoque DEA especifica el conjunto de producción solo en
términos de propiedades deseables como la convexidad y la monotonicidad, sin
imponerle ninguna estructura paramétrica (Banker, Charnes y Cooper, 1984). A
pesar de su uso generalizado, muchas personas continúan clasificando la DEA
como un enfoque no estadístico. Sin embargo, muchos avances recientes han
establecido las propiedades estadísticas de los estimadores de eficiencia de la
DEA. Sobre la base de representaciones estadísticas de DEA, también se han
desarrollado pruebas estadísticas rigurosas de varias hipótesis.
Para empezar, Banker (1993) proporcionó una base estadística formal para
DEA al identificar las condiciones bajo las cuales los estimadores de DEA son
estadísticamente consistentes y maximizan la probabilidad. También desarrolló
pruebas de hipótesis para comparar la eficiencia cuando se compara un grupo de
DMU (unidades de toma de decisiones) con otro. Desde la publicación de Banker
(1993), se han realizado varios avances significativos en el desarrollo de pruebas
de hipótesis basadas en la DEA para abordar un amplio espectro de cuestiones de
relevancia para los usuarios de DEA. Estos incluyen cuestiones como la
comparación de la eficiencia de los grupos, la existencia de ineficiencia de
escala, el impacto de las variables contextuales en la productividad, la idoneidad
de las formas funcionales paramétricas en la estimación de funciones de
producción monótonas y cóncavas, el examen de la separabilidad y
sustituibilidad de los insumos en los sistemas de producción, la existencia de
ineficiencia de asignación y evaluación del cambio técnico y cambio de
productividad. En el resto de este capítulo, describimos diferentes pruebas de
hipótesis basadas en DEA en forma de una lista de referencia para investigadores
y analistas interesados en aplicar DEA a la medición de la eficiencia y la
estimación de la frontera de producción1.
El artículo procede de la siguiente manera. En la siguiente sección, sección 2,
presentamos pruebas estadísticas que son relevantes para aplicaciones de DEA en
entornos donde la desviación de la frontera es causada por una única variable
aleatoria estocástica unilateral que representa la ineficiencia de DMU.
Describimos aspectos sobresalientes de la base estadística proporcionada en
Banker (1993), discutimos las pruebas de hipótesis para la comparación de
eficiencia de grupos de DMU, para la existencia de ineficiencia de escala o
ineficiencia en la asignación y para la sustituibilidad de insumos. En la sección 3,
abordamos situaciones en las que la frontera de producción cambia con el
tiempo. Describimos técnicas basadas en DEA y pruebas estadísticas para
evaluar y probar la existencia de productividad y cambios técnicos a lo largo del
tiempo. En la sección 4, discutimos la aplicación de DEA en entornos donde la
desviación de la frontera de producción surge como resultado de dos variables
estocásticas, una que representa la ineficiencia y la otra el ruido aleatorio.
Explicamos cómo se pueden realizar las comparaciones de eficiencia entre
grupos de DMU y describimos métodos basados en DEA para determinar el
impacto de las variables contextuales o ambientales en la ineficiencia. También
sugerimos métodos para evaluar la idoneidad de una forma paramétrica asumida
para situaciones en las que la guía previa especifica solo la monotonicidad y la
concavidad para una relación funcional. Finalmente, resumimos y concluimos en
la sección 5.

1
Bootstrapping, discutido en el capítulo 10, ofrece un enfoque alternativo para la inferencia
estadística dentro de la estimación de eficiencia no paramétrica.
RD Banker y R. Natarajan
3

2. PRUEBAS DE HIPÓTESIS CUANDO LA


INEFICIENCIA ES LA ÚNICA VARIABLE
ESTOCÁSTICA

Las pruebas descritas en esta sección se basan en el trabajo de Banker (1993)


que proporciona una base estadística formal para las técnicas de estimación
DEA. Describimos brevemente los aspectos más destacados de Banker (1993)
antes de discutir las pruebas de hipótesis.

2.1 Fundamento estadístico para DEA


Considere las observaciones sobre j = 1,….N unidades de toma de decisiones
(DMU), cada observación que comprende un vector de salidas yj ≡ (y1j,… yRj) ≥
0 y un vector de entradas x j ≡ (x1j,… XIj) ≥ 0, donde y∈Y y x∈X, e Y y X son
convexas subconjuntos de ℜR y ℜI, respectivamente. Las magnitudes de entrada y
las variables de proporción de mezcla de salida son variables aleatorias 2. La
correspondencia de producción entre el vector de producción de frontera y0 y el
vector de entrada x0 está representado por la frontera de producción g (y0, x0) =
0. El conjunto de soporte de la frontera es un conjunto convexo y
monótonamente creciente T ≡ {(y, x) | y se puede producir a partir de x}. La
ineficiencia de una DMU específica j es, θj ≡ max Se modela
como una variable aleatoria escalar que toma valores en el rango [1, ∞) y se
distribuye con la función de densidad de probabilidad f (θ) en este rango. Banker
(1993) impone una estructura adicional en la distribución de la variable de
ineficiencia requiriendo que exista una probabilidad distinta de cero de un
desempeño casi eficiente, es decir,

En aplicaciones empíricas de DEA, la variable de ineficiencia θ no se observa


y debe estimarse a partir de los datos de entrada y salida. El siguiente programa
lineal de Banker, Charnes y Cooper (BCC 1984) se utiliza para estimar la
ineficiencia:

Modelar la desviación de la ineficiencia como una variable estocástica que se


distribuye independientemente de las entradas, permitió a Banker (1993) derivar
varios resultados que proporcionan una base estadística para las pruebas de
hipótesis utilizando
2
También se pueden utilizar especificaciones alternativas que especifican cantidades de producción y
proporción de mezcla de insumos como variables aleatorias o decisiones de combinación de insumos
endógenos basadas en precios de insumos modelados como variables aleatorias.
4 Capítulo 11: Pruebas estadísticas basadas en puntuaciones de eficiencia de la

DEA DEA. Demostró que los estimadores DEA de los verdaderos valores de
ineficiencia maximizan la probabilidad siempre que la función de densidad de la
variable aleatoria de ineficiencia f (θ) sea monótona decreciente. También señaló
que una amplia clase de distribuciones de probabilidad, incluidas las
distribuciones exponenciales y medias normales, posee funciones monótonas de
densidad decreciente. Banker (1993) también muestra que el estimador DEA de
la ineficiencia subestima la verdadera ineficiencia en muestras finitas. Más
importante aún, muestra que asintóticamente este sesgo se reduce a cero; es
decir, los estimadores DEA son consistentes si la probabilidad de observar DMU
casi eficientes es estrictamente positiva3.
Si bien la consistencia es una propiedad deseable de un estimador, no guía
por sí misma la construcción de pruebas de hipótesis. Sin embargo, Banker
(1993) explota el resultado de consistencia para probar que para muestras
“grandes” los estimadores DEA de ineficiencia para cualquier subconjunto dado
de DMUs siguen la misma distribución de probabilidad que la verdadera variable
aleatoria de ineficiencia. Este es, quizás, el resultado más importante del artículo
de Banker (1993), ya que implica que, para muestras grandes, los supuestos
distributivos impuestos para la verdadera variable de ineficiencia pueden
trasladarse a la distribución empírica del estimador DEA de ineficiencia y
prueba. Las estadísticas basadas en los estimadores de ineficiencia de la DEA
pueden evaluarse frente a la distribución supuesta de la ineficiencia real.

2.2 Comparación de eficiencia de dos grupos de DMU


Las propiedades asintóticas del estimador de ineficiencia DEA son utilizadas
por Banker (1993) para construir pruebas estadísticas que permitan una
comparación de dos grupos de DMU para evaluar si un grupo es más
eficiente que el otro. Banker (1993) propone pruebas paramétricas y no
paramétricas para evaluar la hipótesis nula de que no hay diferencia en las
distribuciones de ineficiencia de dos submuestras (CCR), G1 y G2, que forman
parte de la muestra de N DMU cuando el tamaño de la muestra, N, es grande.
Para N1 yN2 DMUen los subgrupos G1 y G2, respectivamente, la hipótesis nula de
que no hay diferencia en la ineficiencia entre los dos subgrupos se puede probar
utilizando los siguientes procedimientos:

3
El resultado de consistencia no requiere que la función de densidad de probabilidad f (θ) sea monótona
decreciente. Solo requiere que haya una probabilidad positiva de observar DMU casi eficientes, que es
una condición mucho más débil que la condición de monotonicidad requerida para que los estimadores
DEA sean de máxima verosimilitud.
RD Banker y R. Natarajan 5
(i) Si el logaritmo de la verdadera ineficiencia θj se distribuye como exponencial
4

sobre [0, ∞) para los dos subgrupos, luego, bajo la hipótesis nula de que no hay
diferencia entre los dos grupos, el estadístico de prueba se calcula como

y evaluado con respecto al valor crítico de la


distribución F con (2 N1,2 N2)grados de libertad.
(ii) Si el logaritmo de la verdadera ineficiencia θj se distribuye como la mitad de lo
normal sobre el rango [0, ∞) para los dos subgrupos, luego, bajo la hipótesis
nula de que no hay diferencia entre los dos grupos, el estadístico de prueba se

calcula como y evaluado con respecto al valor


crítico de la distribución F (N1,N2) grados de libertad.
(iii) Si se mantienen no hay tales suposiciones acerca de la distribución de
probabilidad de la ineficiencia, la estadística de prueba una no paramétrica de
Kolmogorov-Smirnov dada por la distancia vertical máxima entre ,
and las distribuciones empíricas de
respectivamente utilizados. Esta estadística, por construcción, toma valores
entre 0 y 1 y un valor alto para esta estadística es indicativo de diferencias
significativas en la ineficiencia entre los dos grupos.

2.3 Pruebas de rendimientos a escala


Examinar la existencia de rendimientos crecientes o decrecientes a escala
es un tema de interés en muchos estudios de la DEA. Proporcionamos una serie
de pruebas basadas en la DEA para evaluar los rendimientos a escala utilizando
puntuaciones de ineficiencia de la DEA5. Considere la ineficiencia estimada
usando el CCR(Charnes, Cooper y Rhodes 1978) obtenida del programa BCC
lineal en (11.1) mediante la supresión de la restricción es decir,

4
Alternativamente, se puede mantener la suposición de que t (θj) se distribuye como exponencial
sobre [0, ∞) donde t (.) Es alguna función de transformación especificada. Entonces, el estadístico de
prueba es

dada por
5
El Capítulo 2 de este manual proporciona una discusión detallada de los aspectos cualitativos y
cuantitativos de los retornos a escala en DEA.
6 Capítulo 11: Statistical Análisis Basado en la DEA eficiencia Scores

Por construcción la ineficiencia de escala se estima como Los


valores de ineficiencia de escala significativamente mayores que 1 indican la
presencia de ineficiencia de escala en la medida en que las operaciones se desvíen
de las de tamaño de escala productiva (MPSS) (Banker 1984, Banker, Charnes y
Cooper 1984). Todas las observaciones en la muestra son eficientes a escala si y
solo si los datos de la muestra pueden ser racionalizados por un conjunto de
producción que exhibe rendimientos constantes a escala.
Bajo la hipótesis nula de no ineficiencia de escala (o de manera equivalente, bajo
la hipótesis nula de rendimientos constantes a escala), es también un estimador
consistente de θj (Banker 1993, 1996). La hipótesis nula de no ineficiencia de
escala en la muestra se puede evaluar construyendo las siguientes estadísticas de
prueba:
(i) Si el logaritmo de la ineficiencia verdadera θj se distribuye de la
exponencial sobre [0, ∞), a continuación, bajo la hipótesis nula de rendimientos
constantes a escala, la prueba estadística se calcula como .Esta
estadística de prueba se evalúa en relación con la distribución Half F| F2N, 2N| con
2N, 2N grados de libertad en el rango [1,∞), ya que por construcción el
estadístico de prueba nunca es menor que 1. La distribución Half F es la
distribución F truncada por debajo en 1, la mediana de la distribución F cuando el
dos grados de libertad son iguales.
(ii) Si el logaritmo de la verdadera ineficiencia θj se distribuye de la
media normal sobre el intervalo [0, ∞), a continuación, bajo la hipótesis nula de
rendimientos constantes, la estadística de prueba se calcula como

y evaluado en relación con la distribución de la mitad de F |


FN, N | con N, N grados de libertad sobre el rango [1, ∞).
(iii) Si se mantienen no hay tales suposiciones acerca de la
distribución de probabilidad de la ineficiencia, un estadístico de prueba no
paramétrico de Kolmogorov-Smirnov dado por la distancia vertical máxima entre
y , las distribuciones empíricas de
respectivamente, se utiliza. Esta estadística, por construcción, toma valores entre
0 y 1 y un valor alto para esta estadística es indicativa de la existencia de una
ineficiencia de escala significativa en la muestra.
Las pruebas anteriores evalúan la hipótesis nula de CCR frente a la
alternativa de VRS. Además, también es posible poner a prueba la hipótesis
nula de no rendimientos decrecientes a escala frente a la alternativa de la
disminución de los rendimientos a escala y la hipótesis nula de los No
Rendimientos crecientes a escala frente a la alternativa de rendimientos
crecientes a escala

Dos estimadores de ineficiencia adicionales requerido para estas


pruebas se calculan resolviendo el programa en (1) después de cambiar la
constante y a . Por construcción

La siguiente es una prueba de la hipótesis nula de rendimientos no decrecientes a


escala contra la alternativa de rendimientos decrecientes a escala:
(i) Si el logaritmo de la ineficiencia verdadera θj se distribuye como la
exponencial sobre [0, ∞), la estadística de prueba se calcula como
o Cada una de estas estadísticas se
evalúa en relación con la distribución Half- F | F 2N, 2N| con 2N, 2N grados
de libertad en el rango [1,∞).
(ii)(ii) Si el logaritmo de la verdadera ineficiencia θj se distribuye como half-
normal en el rango [0, ∞), la estadística de prueba se calcula como

y evaluado en relación con la


distribución Half- F | FN, N| con N, N grados de libertad en el rango [1,∞).
(iii) Si no se mantienen tales supuestos sobre la distribución de probabilidad de
ineficiencia, un estadístico de prueba no paramétrico de Kolmogorov-
Smirnov dado por ya sea la distancia vertical máxima entre
o entre es usado.
Las estadísticas de prueba para probar la hipótesis nula de no rendimientos crecientes a
escala frente a la alternativa de aumentar los rendimientos a escala se pueden desarrollar
de manera similar intercambiando en las estadísticas anteriores.

2.4 Pruebas de eficiencia de asignación


En esta sección, describimos las pruebas basadas en DEA que pueden
usarse para examinar la existencia de ineficiencias de asignación asociadas
con la utilización de insumos. En muchos estudios de la DEA que han
examinado la ineficiencia asociada con la utilización de insumos, la
ineficiencia a menudo se estima utilizando información agregada de gastos de
costos. Banker y col. (2003) abordan la situación cuando no se dispone de
información sobre los precios de los insumos, excepto por el conocimiento de
que las empresas adquieren los insumos en el mismo mercado competitivo.
Emplean el resultado de que la medida de ineficiencia técnica de la DEA
utilizando una única variable de costo agregado, construida a partir de
múltiples insumos ponderados por sus precios unitarios, refleja la ineficiencia
técnica y de asignación agregada. Este resultado se usa luego para desarrollar
pruebas estadísticas de la hipótesis nula de ineficiencia no asignativa
análogas a las de la hipótesis nula de ineficiencia sin escala descrita
anteriormente.

8 Capítulo 11: Pruebas estadísticas basadas en puntuaciones de eficiencia de la


DEA
Para los propósitos de esta sección, considere las observaciones en j = 1,…N
DMUs, cada observación que comprende un vector de salida
y un vector de costos de insumos
para i =1,… I entradas. Cada entradai, i = 1, ...
I, es comprado por todas las empresas en el mismo mercado competitivo a un
precio . Sea el vector de precios de los insumos. Luego el
costo del insumo i para DMU j es entonces . El costo total de los
insumos para DMU j es = .Las cantidades de entrada y el
vector de precios p no son observables por el investigador. Solo la
información de producción y costo es observada. El estimador agregado de
ineficiencia técnica y de asignación, , es estimado usando el siguiente
programa lineal que utiliza salida y datos de costos agregados:

El estimador de ineficiencia técnica

es un estimador consistente de la verdadera ineficiencia técnica


(Banker 1993). Además, el estimador de la ineficiencia en la asignación, se
puede calcular como Bajo la hipótesis nula de que los datos de la
muestra no presenta ninguna ineficiencia en la asignación, es también un
estimador consistente de la verdadera ineficiencia técnica . Esto conduce a
las siguientes pruebas de la hipótesis nula de no ineficiencia asignativa en la
utilización de los insumos en contraposición a la alternativa de existencia de
ineficiencia asignativa:
(i) Si ln( ) se distribuye como exponencial sobre [0, ∞ ), a continuación,
bajo la hipótesis nula de no ineficiencia en la asignación, la estadística
de prueba se calcula como y evaluado en relación con el
valor crítico de la distribución half-F con (2N,2N) grados de libertad.
(ii) Si ln ( ) se distribuye como la mitad de lo normal en el rango [0, ∞ ),
entonces bajo la hipótesis nula de no ineficiencia asignativa, el
estadístico de prueba es calculado como y evaluado
en relación con el valor crítico de la distribución Half-F con (N, N)
grados de libertad.
(iii) Si se mantienen no hay tales suposiciones acerca de la distribución
de probabilidad de la ineficiencia, la prueba estadística no
paramétrica de Kolmogorov-Smirnov dado por la distancia
vertical máxima entre las distribuciones empíricas
de , respectivamente, se utiliza. Esta estadística, por
construcción, toma valores entre 0 y 1 y un valor alto es
indicativo de la existencia de ineficiencia asignativa. También
podría haber situaciones que involucren múltiples salidas y
múltiples entradas donde la información de la cantidad de salida
puede no estar disponible, pero el valor monetario de las salidas
individuales junto con la información de la cantidad de entrada
puede estar disponible. En tales situaciones, la ineficiencia en la
asignación basada en la producción se puede estimar y probar
utilizando procedimientos similares a los descritos anteriormente
para la eficiencia en la asignación basada en los insumos (Banker
et al. 1999).

2.5 Pruebas de separabilidad de entradas


En esta sección describimos las pruebas basadas en DEA que pueden
usarse para evaluar la hipótesis nula de separabilidad de entradas, es decir,
la influencia de cada una de las entradas en la salida es independiente de otras
entradas, contra la hipótesis alternativa de que las entradas son sustituibles.
Las pruebas basadas en la DEA propuestas en esta sección evalúan la
hipótesis nula de separabilidad de entrada sobre todos los datos de la muestra
en contraste con las pruebas paramétricas (Berndt y Wood 1975) que se
operacionalizan solo en la media de la muestra.
Una vez más, considere las observaciones en j = 1,… .N DMU, cada
observación que comprende un vector de salida yj ≡ (y1j,… yRj) ≥ 0, un vector
de entradas xj ≡ (x1j, ≥
… xIj) 0 y una tecnología de producción caracterizada
por un conjunto de posibilidades de producción convexo
y creciente monótono T ≡ {( y, x) | y se puede producir a partir de
x}. La medida de ineficiencia orientada a insumos para esta tecnología se
estima utilizando el siguiente programa lineal BCC - Banker, Charnes y
Cooper (1984):
⎧⎫ ≥, ∀ =; ≤ ∀ = ⎪ ⎪
∑∑ ⎨⎬
NN

λλθ
y yr R xx i I
1, ... / 1, ...;
k rk rj k ik ij
kk
SUB
θ j = argmax 11

==N
θ (11.5)
⎪⎪ =≥∀=
∑ ⎩⎭
λλ
1, 0, 1, ...
kk
k kN
= 1

Cuando las entradas son separables, la ineficiencia de las entradas se


estima primero considerando solo una entrada a la vez, lo que resulta en I
diferentes medidas de ineficiencia correspondientes a las I entradas. La
ineficiencia general de la DMU se estima entonces como el mínimo de estas
medidas de ineficiencia. Específicamente, la ineficiencia correspondiente a la
entrada i se mide como:
10 Capítulo 11: Pruebas estadísticas basadas en puntuaciones de eficiencia

⎧⎫ ≥, ∀ =; ≤ ⎪ ⎪
DEA ∑∑ ⎨⎬

NN

1, ... /;
λλθ
y yr R xx
k rk rj k ik ij i
kk
I
θ j = argmax 11

==
θ (11.6)
i
N

⎪Σ =≥∀=
⎪ ⎩ ⎭ 1, 0, 1, ...

λ λ kk k kN
= 1

La medida ineficiencia bajo el supuesto de separabilidad de entrada


Min =
seentonces estimacomo septiembre θ j {} | yo 1, ....., yo yo
θ j = . Desde sep θ j se
estima a partirun deprograma menos limitada SEP
θ j≥ SUB
θ j. Bajo la hipótesis
nula dede separabilidadentrada,las distribuciones empíricas asintóticos de la SEP θ j

y
SUB
θ j son idénticos, y cada uno recupera la distribución de la verdadera
ineficiencia de entrada θ .
La discusión anterior conduce a las siguientes pruebas de la hipótesis nula
de separabilidad en la utilización de las entradas en oposición a la alternativa
de sustituibilidad de las entradas:
(i) Si ln (θ j ) se distribuye exponencialmente sobre [0, ∞ ), a continuación,
bajo la hipótesis nula de separabilidad de los insumos, la estadística de
prueba se calcula como NN septiembre SUB
Σ Σj y evaluado con respecto al valor crítico de la media
ln
() ln ()
θθ
j
jj
==
11

distribución F con grados de libertad (2 N, 2 N).


(ii) Si ln(θ j) se distribuye como medio-normal en el rango [0, ∞), entonces
bajo la hipótesis nula de separabilidad de entrada, la estadística de prueba se
calcula como NN septiembre SUB
(ln
()) ( ln ())
θθ
∑∑2
2
j jy evaluado en relación con el valor
jj = = 1 1
crítico de la
distribución mitad F con (N, N) grados de libertad.
(iii) Si se mantienen no hay tales suposiciones acerca de la distribución de
probabilidad de la ineficiencia, la prueba estadística de un no paramétrico de
Kolomogorov-Smirnov dado por la distancia vertical máxima entre F (ln (SEP θ j))
y F (ln (θ j)), las distribuciones empíricas de ln (SEP θ j) y ln (SUB θ j),
SUB

respectivamente, se utiliza. Esta estadística, por construcción, toma valores


entre 0 y 1 y un valor alto es indicativo del rechazo de la separabilidad de
insumos en la tecnología de producción.

3. PRUEBAS DE HIPÓTESIS PARA SITUACIONES


CARACTERIZADAS POR CAMBIOS EN
FRONTERA

En la sección anterior, presentamos pruebas DEA que son útiles en


situaciones donde se utilizan datos transversales sobre DMU para análisis de
eficiencia. En esta sección, describimos procedimientos de estimación y
pruebas estadísticas cuando se dispone de datos tanto longitudinales como
transversales sobre DMUs
RD Banker y R. Natarajan 11
y donde el objeto de interés es el cambio en la productividad a lo largo del
tiempo7. Los investigadores de productividad han defendido enfoques tanto
paramétricos como no paramétricos para estimar y analizar el impacto del
cambio técnico y el cambio de eficiencia en el cambio de productividad. La
literatura no paramétrica (por ejemplo, Färe et al 1997, Ray y Desli 1997,
Førsund y Kittelsen 1998) se ha centrado exclusivamente en la medición del
cambio de productividad utilizando el Análisis envolvente de datos (DEA)
sin intentar proporcionar una base estadística para justificar esos métodos.
Recientemente, Banker, Chang y Natarajan (2002) han desarrollado métodos
de estimación basados en DEA y pruebas de cambio de productividad y
cambio técnico. En esta sección se resumen los aspectos más destacados del
informe de Banker et al. (2002) estudio. Para facilitar la exposición, nos
centramos en una única salida en lugar de en un vector de salida múltiple
para ilustrar las técnicas y pruebas de esta sección.
Sea xt = (x1t, ... xit,… xIt) ∈ X, xit > 0, t = 0,1 ser el vector de entrada I-
dimensional en el período t. Considere dos valores posibles del subíndice de
tiempo t correspondiente a un período base (t = 0) y otro período (t = 1). La
correspondencia de producción en el tiempo t entre la producción de la
frontera y la
ty
*

t
entrada x t y = φ (xt), t = 0,1 (11.7) *

t, se representa como

La función φt(.): X→ ℜ+ está restringido a ser monótono creciente y cóncavo


en la entrada xt pero no es necesario que siga ninguna forma funcional
paramétrica específica. El vector de entrada xt, la función de producción
φt(xt) y una α
variable aleatoria de eficiencia relativa, t , que toma valores entre
-∞ y 0,
determinan en conjunto la producción t, en el período t8. Específicamente,
realizada, y
yt φ ≡t eα t(xt)(11,8) Para la configuración anterior, los
estimadores de cambio técnico, cambio en la eficiencia relativa y el cambio
de la productividad, respectivamente, () N
j b,
() N

jr y
() N

j g , para el

jth DMU puede estimarse a partir valores de salida observadas y estimadores


de salidas de frontera utilizando las siguientes expresiones:
() N
ln
1 () ln () φ φ xx j - j1
b=
j { () ()} 10

ln
11 0 0 / () ln / () jj jj yy φ φ x - x
r=
j {() ()} 10

() N

ln
11 0 0 / () ln / () jj jj yy φ φ x - x (11.9)
g=
j {() ()} 00

() N

7
El tratamiento del cambio de productividad en esta sección proporciona una alternativa a los
tratamientos que utilizan el índice de Malmquist descrito en el capítulo 5 y, además, tiene
la ventaja de proporcionar caracterizaciones estadísticas explícitas.
8
La variable aleatoria de eficiencia relativa y la medida de ineficiencia están vinculadas por la

α
relación = -ln ( ). tt θ αt t θ

12 Capítulo 11: Análisis estadístico basado en la DEA eficiencia Scores

Estos estimadores satisfacen la relación fundamental que el cambio de la


productividad es la suma del cambio técnico y el cambio eficiencia relativa
es decir, j g = () N
() N
j r . Los productos de frontera
jb +
() N
requeridos para la estimación de las
diversas medidas de cambio en (11.9) se estiman utilizando programas
lineales. El j0 () 0 φ x 1j1 φ () x
estimación de y, se realiza utilizando sólo lasde entrada-salida
observacionesde la época o período de base 1, como puede ser el caso. El j0
() 0 φ x
programalineal para estimar es el siguiente modelo Banker, Charnes y
Cooper (BCC 1984):
⎫ΣΣ ≥ φ; ≤ ∀ = ⎪ ⎪ φ⎪ ⎪ =≥∀= I
⎧ ⎨⎬ ∑ ⎩ ⎭ (11.10)
NN

ˆ, 1, ...;

Λλ
y xxi
00
kkk ik ij
kk
00000
j0 () 0 φ x = argmax 11==

1, 0, 1, ...
k
λλ k
00
kN
= 0 k0
1 j1 φ)(se x

Un programa similar utiliza para estimar a partir de datos de entrada y


salida 1

j0 () 0 φ x 1j1 φ () x 0(xj0)y
de período 1. y son estimadores consistentes de φ
φ1(xj1), respectivamente, (Banker 1993).
El valor de la frontera del período base, φ0(xj1), correspondiente a la
período 1 entrada del, xj1, se estima con base en el siguiente programa lineal:
⎧⎫ ≥ φ; ≤ ∀ = ⎪ ⎪ φ⎪ ⎪ =≥∀= I
∑∑ ⎨⎬ ∑ ⎩ ⎭ (11.11)
NN

ˆ, 1, ...;

Λλ
yx xi
00
kkk ik ij
kk
00001
j1 () φ x = argmax
0 11==

1, 0, 1, ...
k
λλ k
00
kN
= 0 k0
1

o = yj1 cuando el programa lineal anterior no es factible Tenga en cuenta que


la diferencia entre el modelo anterior y el modelo BCC tradicional es que la
observación bajo evaluación no está incluida en el conjunto de referencia
para las restricciones en (11.11) como en el modelo de supereficiencia
descrito por primera vez en Banker, Das y Datar (1989) y Anderson y
φ
Petersen (1993). Es el caso de que j1 es un estimador consistente de () 0 φ x
0
(xj1).Dados los valores N de cambios técnicos, de eficiencia relativa y de
productividad estimados con (11.9), los estimadores de las medianas de estas
medidas de desempeño son
1 ˆ | bb |
NN

= Argmin MD b (N)
(N)

∑-
j= j
1

1
| rr | NN
∑-
MD (N)
rˆ = argmin (N)
j= j
1

1
| gg | NN
∑ - (11.12)
MD (N)
gˆ = argmin (N)
j= j
1

RD Banker y R. Natarajan 13 Banker et al. (2002) muestran que, MD (N) b ()


MD N

r y () MD N
j

j g sonconsistentes

estimadoresde la mediana de la población del cambio técnico MD β , la


mediana de la población del cambio de eficiencia relativa MD ρ y la mediana
del cambio de la productividad de la población MD γ , respectivamente.
Considere el número de observaciones, (N) pˆ β , (N) pˆ ρ y (N) pˆ γ (fuera de la
muestra de n observaciones) para los que () N
j b,
() N

jr y
() N

j g , respectivamente, es

estrictamente positivo. Tests for the median of the various performance


measures being equal to zero are conducted as follows:
(a) Under the null hypothesis of zero median technical change between
the base period and period t ie, = 0, the statistic MD β (N) pˆ β is asymptotically
distributed as a binomial variate with parameters N and 0.5 ie, (N) pˆ β ~
b(N,0.5).
(b) Under the null hypothesis of zero median relative efficiency change
between the base period and period t ie, MD ρ = 0, the statistic (N) pˆ ρ is
asymptotically distributed as a binomial variate with parameters N and 0.5 ie,
~ b(N,0.5). (N) pˆ ρ
(c) Under the null hypothesis of zero median technical change between
the base period and period t ie, MD γ = 0, the statistic (N) pˆ γ is asymptotically
distributed as a binomial variate with parameters N and 0.5 ie, (N) pˆ γ ~
b(N,0.5).
Banker et al. (2002) also provide methods for estimating and testing the
location of the population mean of the various performance measures. The b

, mean relative efficiency change ( ) N


mean technical change ( ) N 1ˆˆ
(ln( ( )) ln( ( )))
l( ) N
productivity change
b =
10
g are estimated as
r and mean

()N
1ˆˆ yy
N ln / ( ) ln / ( ) jj jj N φ φ xx −
N jφ φ =∑ xx − j1 1 1
j

r=
()
ˆN { ( )( )} 10

11 0 0

1ˆˆ yy
ln / ( ) ln / ( ) jj jj N φ φ x − x (11.13)
=
()
ˆ Ng { ( )( )} 00

11 0 0

b , ˆ r and ˆ g are consistent estimators of the population mean


() N () N
()N

technical change, β, population mean relative efficiency change, ρ, and


population productivity change, γ , respectively.

14 Chapter 11: Statistical Tests Based on DEA Efficiency Scores Nbs β ,

ˆ
Next consider the statistics = (N) t () β( )ˆ( ) N
ˆ l( )
Nrs ρ and = t () γ ˆ( )
(N)

N
ˆ
= (N) t () ρ( )ˆ( ) N Ngs γ where
⎛⎞⎛⎞ −−⎜⎟⎝⎠
⎜⎟∑ ⎝⎠
2 ()
2 10

xx −
ˆˆ N ˆ
11
1 ln( ( )) ln( ( )) 1 N s ()()
2 ()
(β) = 2 2 10

⎛⎞⎛⎞ −−− N⎝
jj
φ φ Nb N =
j ⎜⎟∑ ⎜⎟ xx
ˆˆ N
⎠ 11 0 0
1 ln( / ( )) ln( / ( )) 1 N
⎝⎠
ˆ
s ()()
2
(ρ) = 2 2()
N
⎛⎞⎛⎞ −−⎜⎟⎝⎠ N
jj jj
j yyN φ φ r = ⎜⎟∑ ⎝

(γ) = ˆˆ
sˆ ( ) ( )( ) l ( ) 11 0 0
1 ln / ( ) ln / ( ) 1

xx N − (11.14)
jj jj
y yN φ φ g =
j
00
2 ˆ
(N)
t () γ

For large samples, the distribution of


ˆ ˆ
each of (N) t () β , (N) t () ρ and
approaches that of a Student's T variate with N-1 degrees of freedom. Therefore,
a simple t-test for the mean of the DMU-specific estimators for the various
performance measures estimated using (11.9) is appropriate when the sample
size is large.

4. HYPOTHESIS TESTS FOR COMPOSED ERROR


SITUATIONS

The tests described in the previous sections are conditioned on a data


generating process that characterizes the deviation of the actual output from the
production frontier as arising only from a stochastic inefficiency term. In this
section, we describe the application of DEA-based tests for composed error
situations where the data generating process involves not only the one
sided inefficiency term but also a noise term that is independent of the
inefficiency. Recently, Gsatch (1998) and Banker and Natarajan (2001) have
developed DEA-based estimation procedures for environments characterized by
both inefficiency and noise. The tests developed by Banker (1993) can be
adapted to these environments through an appropriate transformation of the
inefficiency term. We describe these tests below:

4.1 Tests for Efficiency Comparison


Consider observations on j = 1,….N DMUs, each observation comprising a
single output yj ≥ 0 and a vector of inputs xj ≡ (x1j, …xIj) 0.

The production correspondence between 0 and the I
the frontier output y
inputs is represented as y0 = g(x) subject to the assumption that g(.) is
monotonically increasing and concave in x. The deviation from the frontier for
the jth DMU could be positive or negative and is represented as εj = uj - vj
RD Banker and R. Natarajan 15

= g(xj) – yj. Thus, the deviation is modeled as the sum of two components, a one-
sided inefficiency term, uj, and a two-sided random noise term vj bounded above
at VM, analogous to composed error formulations in parametric stochastic
frontier models (Aigner et al. 1977, Meussen and van den Broeck 1977, Banker
and Natarajan 2001). In this stochastic framework, Banker and Natarajan (2003)
propose two statistical tests to compare the efficiency of two groups of DMUs.
As before, consider two sub-samples, G1 and G2, that are part of the sample of N
DMUs when the sample size, N, is large. Let the true inefficiency, uj, be
distributed with means 1 u and 2 u in the two groups. Further assume that the
ˆ
variance of the inefficiency is the same in both u
groups. Define j u = VM – vj + uj. We can estimate j , a consistent u
estimator of j , by applying DEA on input and output data from the full
sample of N DMUs. For N 1 and N2 DMUs in subgroups G1 and G2,
respectively, the null hypothesis of no difference in mean inefficiency between
ˆ
the two subgroups can be tested using the following procedures: u 0 + a1zj + ej
estimated using a total
(i) Consider the OLS regression = a j
of N1+N2 DEA inefficiency scores. zj is a dummy variable that takes a value of 0
if a particular DMU belongs to group G1 and 1 if it belongs to G2 and ej is an iid
error term. The regression coefficient l1 a is a consistent estimator of 2 u - 1 u , the
difference in mean inefficiency between groups G 2 and G1. The t-statistic
associated with this regression coefficient can be used to evaluate whether two
groups are significantly different in terms of mean inefficiency.
(ii) Assume that the probability distributions of the inefficiency random
variable uj and the noise random variable v j are such that u j = VM – vj + uj is
distributed as a log-normal variable in the two groups. Under the null hypothesis
that the mean inefficiencies are equal ie, 1 u = 2 u and assuming
ˆ
t
11
that the variance of uj is the same in the two groups, the Student-t statistic
ˆ lu lu S
NN
⎛⎞−⎜⎟
⎝ ⎠ + distributed with (N1+N2-2) degrees of freedom
m
m
j j
=
12
12

1 ˆ ln(u )
can be used to evaluate the null hypothesis of no difference in mean
m
NNj=∑ , j 2 lu = 2j2 1 2
jm 1 ˆ ln(u ) N
inefficiency across the two groups. 1 N j=∑
lu is 1
1j1 1

0.5
⎧⎫ ⎧ ⎫⎧ ⎫ ⎜ ⎟
⎛⎞ ⎪⎪ ⎨ ⎨ ⎬ ⎨ ⎬⎬ ∑ ∑ −+ −
m 2 2 NN
1 ˆ ˆ ln(u ) lu ln(u ) lu
NN2 jj = =
ˆ m
and = S 1 2 j j
.
+− ⎩ ⎭⎩ ⎭
j1 1 j2 2 1 1
12 ⎪⎪ ⎝⎠⎩⎭

16 Chapter 11: Statistical Tests Based on DEA Efficiency Scores

4.2 Tests for Evaluating the Impact of Contextual


Variables on Efficiency
Analysis of factors contributing to efficiency differences has been an
important area of research in DEA. Ray (1991), for instance, regresses DEA
scores on a variety of socio-economic factors to identify key performance drivers
in school districts. The two-stage approach of first calculating productivity scores
and then seeking to correlate these scores with various explanatory variables has
been in use for over twenty years but explanations of productivity differences
using DEA are still dominated by ad hoc speculations (Førsund 1999). Banker
and Natarajan (2001) provide a general framework for the evaluation of
contextual variables affecting productivity by considering a variety of Data
Generating Processes (DGPs) and present appropriate estimation methods and
statistical tests under each DGP. In this section, we describe the DEA-based tests
developed in Banker and Natarajan (2001) that can be used to determine the
impact of contextual or environmental variables on efficiency.
Consider observations on j = 1,….N decision making units (DMUs), each
observation comprising a single output y j ≥ 0, a vector of inputs xj ≡ (x1j, …xIj) ≥
0, and a vector of contextual variables zj≡ (z1j, … zSj) that may influence the
overall efficiency in transforming the inputs into the outputs. The production
function g(.) is monotone increasing and concave in x, and relates the inputs and
contextual variables to the output as specified by the equation
yj = g(xj) +vj – h(zj) – uj (11.15) where vj is a two-sided random noise term
bounded above at VM, h(zj) is a non-negative monotone increasing function,
convex in z and uj is a one-sided inefficiency term. The inputs, contextual
variables, noise and inefficiency are all independently distributed of each other.
Defining = g(x j g (x ) j) + VM = (VM - vj) + h(zj) + uj ≥ 0, (11.15) can be
expressed as
and δ j
(11.16)
yj = - j g (x ) δ j
gramo (.)
Since is derived from g(.) by multiplication with a positive constant,
g (.)
ˆ
is also monotone increasing and concave. Therefore, the DEA δ j
inefficiency estimator,
inputs
, obtained by performing DEA on the
output observations (yj, xj), j = 1, . . .N, is a consistent estimator of δ j (Banker
1993). This consistency result is used by Banker and Natarajan (2001) to develop
the following DEA-based tests corresponding to different specifications of h(.),
the function linking contextual variables to inefficiency.
RD Banker and R. Natarajan 17

Consider the case where h(z) = h(z;β) and h(z;β) is a non-negative function,
monotone increasing in z, linear in β. In this case, the impact of contextual
variables can be consistently estimated by regressing the first stage DEA
ˆ
estimate δ j
on the various contextual variables associated with
the various components of the β vector. This procedure yields consistent
estimators of the parameter vector β. In the special case where h(z;β) = N
, the independent variables in the regression are the same as

j
z'β = zβ =
1 jj

the S contextual variables.


Now, suppose no additional structure can be placed on h(zj) except that it is a
non-negative monotone increasing function, convex in z. Let j ε = (VM = h(zj) +
j ε and a second stage DEA estimation on the
Then
- vj) + uj. δj
ˆ
pseudo "input-outputs" observations (,) δ jj z yields a consistent estimator ˆj ε
for j ε (Banker 1993). This estimator is obtained by solving the following linear
programming formulation analogous to the BCC model (Banker, Charnes and
Cooper 1984) in DEA individually for each observation in the sample:
ˆ
, 1,... ;
⎧⎫ =;≥∀=⎪⎪
∑∑ ⎨⎬
NN

λδ ψ λ zzi S
kkk ik ij
kk

ˆψ j = argmin 1 1
==N
ψ (11.17)
⎪⎪ = ≥ ∀=
∑ ⎩ ⎭ 1, 0, 1,...

λ λ kk k kN
= 1

A consistent estimator for j ε for each observation in the sample is obtained


ˆˆ
as ˆ . jjj ε = − δ ψ
To evaluate the statistical significance of individual z s, a third stage DEA
ˆ S − -s
estimation is first performed on the pseudo observations ( , δ jj z ) where z is
the original z vector without the zs variable. The following modified version of
the program in (11.17) is used for this purpose.
ˆ
, 1,., 1, 1,.. ;
⎧⎫ =;≥∀=−+⎪⎪
∑∑ ⎨⎬
NN

λδ ψ λ zzi ss S
kkk ik ij
kk

ˆ s ψ j− = argmin 1 1
==N
ψ (11.18)
⎪⎪ = ≥ ∀=
∑ ⎩⎭
kN
1, 0, 1,...
λλ
kk
k
=
1 ˆ
j ε − = ˆ js δ j ψ− − . Since (11.18) is a
Let the resulting estimator of j ε be ˆ s

less constrained program than (11.17), ˆ


s

j ε − ≥ ˆj ε for all observations j =


1,…N.
18 Chapter 11: Statistical Tests Based on DEA Efficiency Scores

Under the null hypothesis that the marginal impact of zs (ie ∂h(z)/∂zs if h(.) is
differentiable) is zero, the asymptotic distributions of ε and s ε− are identical
(Banker 1993). If the asymptotic distribution of j ε is assumed to be exponential
or 2 2
or half-normal, the null hypothesis of no impact of zs is tested ∑ ∑
ˆ ˆ NN s ˆ NN s ˆ
by comparing the ratios ⎡⎤⎡⎤ jε ε

∑ ∑ ⎣ ⎦ ⎣ ⎦ j
ε ε − jj jj = = jj

11
against critical ==
11

values obtained from half-F distributions with (2N,2N) or (N,N) degrees of


freedom, respectively. If j ε is exponentially distributed, the test statistic is
evaluated relative to the half-F distribution |F 2N,2N| with 2N,2N degrees of
freedom over the range [1,∞), since by construction the test statistic is never less
than 1. If j ε is a half-Normal variate then the test statistic is evaluated relative to
the half-F distribution |FN,N| with N,N degrees of freedom over the range [1,∞).
Recall that ε = u + (VM - v). Therefore, statistics based on Banker (1993) may
not be valid unless the variance of the noise term v is considerably smaller than
the variance of the inefficiency term, u, and u is distributed with a mode at its
lower support.
The Kolmogorov-Smirnov statistic, which is based on the maximum vertical
distance between the empirical cumulative distribution of ˆ
s

j ε − and
j ε , can also be used to check whether the empirical distributions of ˆ s
ˆˆ jε

and
j ε are significantly different. If they are significantly different, then it can be
established that zs has a significant impact on productivity.

4.3 Tests for Evaluating the Adequacy of Parametric


Functional Forms
While DEA provides a theoretically correct way to estimate monotone and
concave (or convex) functional relationships, it is often useful to represent the
relationship in a more parsimonious functional form that is afforded by a
parametric specification. Specific parametric functional forms, such as the Cobb-
Douglas, are useful if they provide a good approximation to the general
monotone and concave (or convex) function as evidenced by sample data. In this
section, we present methods developed in Banker, Janakiraman and Natarajan
(2002) to evaluate the adequacy of a parametric functional form to represent the
functional relationship between an endogenous variable and a set of exogenous
variables given the minimal maintained assumption of monotonicity and
concavity.
Consider sample data on an endogenous variable and I exogenous variables
for N observations. For the jth observation, denote the endogenous
RD Banker and R. Natarajan 19

variable as yj and the vector of exogenous variables as 1 2 ( , ,... ) X jjj Ij ≡ xx x . The


relationship between j y and X j is specified as:
jj y gX eε
= (11.19)
()j
g(.)
where is a monotone increasing and concave function. It is assumed
further that function f ( ) ε over the range[ , ] ,
j ε is independent of X j and iid with a where LU −SS ⊆ ℜ L S ≥ 0, and
probability density US ≥ 0
are unknown parameters that describe the lower and upper supports of the
distribution. Define . The DEA estimator of ( ) g X j can
() () SU g X gXe = and ε j Uj = S − ≥ ε 0 be
such that (11.19) j gX e−ε
can be rewritten as yj = ( ) j
estimated using the following linear program:
⎧⎫ =;≤∀=⎪⎪
∑∑ ⎨⎬
NN

λλ
y xxi I
y , 1,... ;
kkk ik ij
kk

ˆ
( ) DEAj g X = argmax 1 1
==N
y (11.20)
⎪⎪ = ≥ ∀=
∑ ⎩⎭
λλ kN
1, 0, 1,...
kk
k
= 1
An estimator for j ε for each observation in the sample can then be obtained
ˆ
as ˆ ln( ( )) ln( ) DEA
DEA

ˆ DEA
jj ε = − gX y j . Further, ( ) j g X and ˆ
DEA

j ε are

consistent estimators of ( ) g X j and j ε respectively (Banker 1993). The


parametric estimation is carried out by specifying a parametric form g X(;) β
and regressing ln(y) on the exogenous variables in ln( g X(;) β ). The residuals
ˆ ˆ
from the regression are used to obtain max{ln( ) ln( ( ; ))} ˆ U S y gX = − j β
which is a consistent estimator of
US
ˆ
(Greene 1980). The estimated deviation from the parametric frontier is j ε =
ˆ
ln( ( ; )) ln( ) ˆ j U gX S y β + − j . In addition to ˆDEA ε ,
then calculated as ˆ PARAM ˆ PARAM

j ε also is a consistent estimator of j ε under the null hypothesis that g X(;) β =


g( ) X for all X. Banker et al. (2002) prove that the asymptotic distribution of
ˆPARAM ε retrieves the true distribution of ε if the parametric specification is, in
fact, the true specification of the production function (ie, gX gX (;) () β = for all
X). Further, they also show that if the parametric specification is, in fact, the true
specification of the production function then as N → ∞, (a) the asymptotic
ˆ PARAM ˆ DEA
distribution of ε converges to that of ε
ˆ DEA
j and ε

ˆ PARAM j converge asymptotically to for all j ∈


and (b) both ε J,

where J is a given set of observations. Based on these results, they suggest the
following four tests for testing the adequacy of the parametric functional form:
20 Chapter 11: Statistical Tests Based on DEA Efficiency Scores

(a) The first test uses the Kolmogorov-Smirnov test statistic given by the
ˆ DEA ˆ PARAM
maximum vertical distance between ˆ ( F j ε and , where ˆ ( F jε )
)
ˆ DEA ˆ PARAM
) ˆ ( F j ε and denote the empirical distributions of ˆ ( F j ε ) ˆ DEA
j ε and
ˆ PARAM

jε respectively. A low value is indicative of support for the null hypothesis that
g X(;) β adequately represents g( ) X .
(b) The second procedure is based on the regression of rank of ˆ
DEA

j ε on

the rank of ˆ
PARAM

j ε (Iman and Conover 1979). Under the null hypothesis that the

parametric form is adequate, the expected value of the coefficient on ˆ PARAM


j ε in the rank regression is asymptotically equal to 1. The null hypothesis is
evaluated against the alternative hypothesis that the regression coefficient has a
value less than 1.
ˆ
(c) The third test procedure employs the Wilcoxon rank-sum test to ˆ ( )
PARAM
F jε
ˆ DEA
evaluate whether the empirical distributions ˆ ( ) F j ε and are different. If the
test shows these distributions to be different, the adequacy of the parametric form
is rejected.
(d) The fourth procedure is based on Theil's (1950) distribution-free test. This
test evaluates the null hypothesis that 1 μ =1 against the alternative 1 μ ≠1 in the
relation 0 1 ˆ ˆ DEA PARAM ε μ με = + . To compute Theil's statistic, the difference ˆ
ˆ DEA PARAM Djj j = − ε ε is calculated and then the data are sorted by ˆ PARAM
j ε . Next, a score cji = 1, 0 or -1 is assigned for each i< j depending on whether

Dj - Di > 0, = 0 or < 0 respectively. Theil's test statistic C is N


= ∑ . Theil's test statistic is distributed as a standard normal
defined as C c ji j
= 1

variate for large samples and a high absolute value of C rejects the adequacy of
the parametric functional form.
Banker et al. (2002) also propose an alternative approach to evaluating the
adequacy of a parametric functional form. The approach suggested by them relies
on Wooldridge's (1992) Davidson-Mackinnon type test to evaluate a linear null
model against a nonparametric alternative. Banker et al. (2002) propose the use
of a sieve DEA estimator as the nonparametric alternative for the purposes of
Wooldridge's test since the test cannot be applied directly when the
nonparametric alternative is based on the traditional DEA estimator. Interested
readers are referred to section 2.3 of Banker et al. (2002) for additional details on
how Wooldridge's test can be applied to examine the adequacy of a specified
parametric form for a monotone and concave function.
RD Banker and R. Natarajan
21

5. CONCLUDING REMARKS
Hemos descrito aquí varias pruebas estadísticas que pueden utilizarse para
probar hipótesis de interés y relevancia para los usuarios aplicados del Análisis
Envolvente de Datos. Un tema común subyacente a estas pruebas es que la
desviación de la frontera del DEA puede verse como una variable estocástica.
Mientras que el estimador del DEA está sesgado en muestras finitas, el valor
esperado del estimador del DEA es casi seguro el verdadero valor del parámetro
en muestras grandes. Las pruebas descritas en este documento se basan en esta
propiedad asintótica del estimador DEA.
Una advertencia importante es que las pruebas descritas en este documento
están diseñadas para muestras grandes. Los resultados de los estudios de
simulación realizados sobre muchas de las pruebas propuestas en este estudio
sugieren que estas pruebas funcionan muy bien para tamaños de muestra
similares a los utilizados en muchas aplicaciones típicas de DEA. Estas pruebas
deben utilizarse con precaución en muestras pequeñas. Creemos que es necesario
realizar más estudios de simulación para aportar pruebas sobre el rendimiento de
las pruebas aquí descritas en muestras pequeñas. Está claro que se trata de un
área importante para la investigación futura.
Creemos que hay muchas más vías y áreas en las que se pueden aplicar las
pruebas estadísticas basadas en DEA. Esto se debe a que la estructura flexible de
DEA facilita la aplicación en un gran número de situaciones en las que la falta de
información u orientación puede impedir el uso de métodos paramétricos. Las
pruebas estadísticas desarrolladas durante los últimos 10 años han contribuido
significativamente a la fiabilidad de las implicaciones políticas y de gestión de
los estudios de DEA y creemos que seguirán enriqueciendo las futuras
aplicaciones de DEA.

REFERENCES
1. Aigner, DJ, Lovell, CAK and Schmidt, P., 1977. Formulation and Estimation
of Stochastic Frontier Production Function Models. Journal of
Econometrics, 6, 21-37.
2. Anderson, P., and Petersen, NC, 1993. A Procedure for Ranking Efficient
Units in Data Envelopment Analysis. Management Science 39, 1261-1264.
3. Banker, RD, 1984. Estimating Most Productive Scale Size Using Data
Envelopment Analysis. European Journal of Operations Research, July,
35-44.

9
Banker (1996) provides details on some of these simulation studies. Based on the results of
these studies, it appears that the tests described in this paper perform well in sample sizes
of the order of 50 or more.
https://www.ugr.es/~erivera/PaginaDocencia/Posgrado/Documentos/ClementeC
uadernoInferencial.pdf

¿Cuál es la diferencia entre pruebas paramétricas y no


paramétricas?
Las pruebas paramétricas asumen distribuciones estadísticas subyacentes a
los datos. Por tanto, deben cumplirse algunas condiciones de validez, de
modo que el resultado de la prueba paramétrica sea fiable. Por ejemplo, la
prueba t de Student para dos muestras independientes será fiable solo si cada
muestra se ajusta a una distribución normal y si las varianzas son
homogéneas.

Las pruebas no paramétricas no deben ajustarse a ninguna distribución.


Pueden por tanto aplicarse incluso aunque no se cumplan las condiciones de
validez paramétricas. Las pruebas paramétricas tienen muchas veces sus
equivalentes no paramétricos. Encontrará las diferentes pruebas paramétricas
junto con sus equivalentes (en el caso de que existan) en esta tabla.

¿Cuál es la ventaja de usar una prueba no paramétrica?


Las pruebas no paramétricas son más robustas que las paramétricas. En otras
palabras, son válidas en un rango más amplio de situaciones (exigen menos
condiciones de validez).

¿Cuál es la ventaja de usar una prueba paramétrica?


La ventaja de usar una prueba paramétrica en lugar de una no paramétrica
consiste en que la primera tiene más potencia estadística que la segunda. En
otras palabras, una prueba paramétrica tiene mayor capacidad para conducir a
un rechazo de H0. La mayoría de las veces, el valor p asociado a una prueba
paramétrica es menor que el valor p asociado a su equivalente no paramétrica
ejecutada sobre los mismos datos.

También podría gustarte