Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. INTRODUCCIÓN
El análisis envolvente de datos (DEA) sigue utilizándose ampliamente en
muchos entornos para analizar los factores que influyen en la eficiencia de las
organizaciones. El enfoque DEA especifica el conjunto de producción solo en
términos de propiedades deseables como la convexidad y la monotonicidad, sin
imponerle ninguna estructura paramétrica (Banker, Charnes y Cooper, 1984). A
pesar de su uso generalizado, muchas personas continúan clasificando la DEA
como un enfoque no estadístico. Sin embargo, muchos avances recientes han
establecido las propiedades estadísticas de los estimadores de eficiencia de la
DEA. Sobre la base de representaciones estadísticas de DEA, también se han
desarrollado pruebas estadísticas rigurosas de varias hipótesis.
Para empezar, Banker (1993) proporcionó una base estadística formal para
DEA al identificar las condiciones bajo las cuales los estimadores de DEA son
estadísticamente consistentes y maximizan la probabilidad. También desarrolló
pruebas de hipótesis para comparar la eficiencia cuando se compara un grupo de
DMU (unidades de toma de decisiones) con otro. Desde la publicación de Banker
(1993), se han realizado varios avances significativos en el desarrollo de pruebas
de hipótesis basadas en la DEA para abordar un amplio espectro de cuestiones de
relevancia para los usuarios de DEA. Estos incluyen cuestiones como la
comparación de la eficiencia de los grupos, la existencia de ineficiencia de
escala, el impacto de las variables contextuales en la productividad, la idoneidad
de las formas funcionales paramétricas en la estimación de funciones de
producción monótonas y cóncavas, el examen de la separabilidad y
sustituibilidad de los insumos en los sistemas de producción, la existencia de
ineficiencia de asignación y evaluación del cambio técnico y cambio de
productividad. En el resto de este capítulo, describimos diferentes pruebas de
hipótesis basadas en DEA en forma de una lista de referencia para investigadores
y analistas interesados en aplicar DEA a la medición de la eficiencia y la
estimación de la frontera de producción1.
El artículo procede de la siguiente manera. En la siguiente sección, sección 2,
presentamos pruebas estadísticas que son relevantes para aplicaciones de DEA en
entornos donde la desviación de la frontera es causada por una única variable
aleatoria estocástica unilateral que representa la ineficiencia de DMU.
Describimos aspectos sobresalientes de la base estadística proporcionada en
Banker (1993), discutimos las pruebas de hipótesis para la comparación de
eficiencia de grupos de DMU, para la existencia de ineficiencia de escala o
ineficiencia en la asignación y para la sustituibilidad de insumos. En la sección 3,
abordamos situaciones en las que la frontera de producción cambia con el
tiempo. Describimos técnicas basadas en DEA y pruebas estadísticas para
evaluar y probar la existencia de productividad y cambios técnicos a lo largo del
tiempo. En la sección 4, discutimos la aplicación de DEA en entornos donde la
desviación de la frontera de producción surge como resultado de dos variables
estocásticas, una que representa la ineficiencia y la otra el ruido aleatorio.
Explicamos cómo se pueden realizar las comparaciones de eficiencia entre
grupos de DMU y describimos métodos basados en DEA para determinar el
impacto de las variables contextuales o ambientales en la ineficiencia. También
sugerimos métodos para evaluar la idoneidad de una forma paramétrica asumida
para situaciones en las que la guía previa especifica solo la monotonicidad y la
concavidad para una relación funcional. Finalmente, resumimos y concluimos en
la sección 5.
1
Bootstrapping, discutido en el capítulo 10, ofrece un enfoque alternativo para la inferencia
estadística dentro de la estimación de eficiencia no paramétrica.
RD Banker y R. Natarajan
3
DEA DEA. Demostró que los estimadores DEA de los verdaderos valores de
ineficiencia maximizan la probabilidad siempre que la función de densidad de la
variable aleatoria de ineficiencia f (θ) sea monótona decreciente. También señaló
que una amplia clase de distribuciones de probabilidad, incluidas las
distribuciones exponenciales y medias normales, posee funciones monótonas de
densidad decreciente. Banker (1993) también muestra que el estimador DEA de
la ineficiencia subestima la verdadera ineficiencia en muestras finitas. Más
importante aún, muestra que asintóticamente este sesgo se reduce a cero; es
decir, los estimadores DEA son consistentes si la probabilidad de observar DMU
casi eficientes es estrictamente positiva3.
Si bien la consistencia es una propiedad deseable de un estimador, no guía
por sí misma la construcción de pruebas de hipótesis. Sin embargo, Banker
(1993) explota el resultado de consistencia para probar que para muestras
“grandes” los estimadores DEA de ineficiencia para cualquier subconjunto dado
de DMUs siguen la misma distribución de probabilidad que la verdadera variable
aleatoria de ineficiencia. Este es, quizás, el resultado más importante del artículo
de Banker (1993), ya que implica que, para muestras grandes, los supuestos
distributivos impuestos para la verdadera variable de ineficiencia pueden
trasladarse a la distribución empírica del estimador DEA de ineficiencia y
prueba. Las estadísticas basadas en los estimadores de ineficiencia de la DEA
pueden evaluarse frente a la distribución supuesta de la ineficiencia real.
3
El resultado de consistencia no requiere que la función de densidad de probabilidad f (θ) sea monótona
decreciente. Solo requiere que haya una probabilidad positiva de observar DMU casi eficientes, que es
una condición mucho más débil que la condición de monotonicidad requerida para que los estimadores
DEA sean de máxima verosimilitud.
RD Banker y R. Natarajan 5
(i) Si el logaritmo de la verdadera ineficiencia θj se distribuye como exponencial
4
sobre [0, ∞) para los dos subgrupos, luego, bajo la hipótesis nula de que no hay
diferencia entre los dos grupos, el estadístico de prueba se calcula como
4
Alternativamente, se puede mantener la suposición de que t (θj) se distribuye como exponencial
sobre [0, ∞) donde t (.) Es alguna función de transformación especificada. Entonces, el estadístico de
prueba es
dada por
5
El Capítulo 2 de este manual proporciona una discusión detallada de los aspectos cualitativos y
cuantitativos de los retornos a escala en DEA.
6 Capítulo 11: Statistical Análisis Basado en la DEA eficiencia Scores
λλθ
y yr R xx i I
1, ... / 1, ...;
k rk rj k ik ij
kk
SUB
θ j = argmax 11
==N
θ (11.5)
⎪⎪ =≥∀=
∑ ⎩⎭
λλ
1, 0, 1, ...
kk
k kN
= 1
⎧⎫ ≥, ∀ =; ≤ ⎪ ⎪
DEA ∑∑ ⎨⎬
NN
1, ... /;
λλθ
y yr R xx
k rk rj k ik ij i
kk
I
θ j = argmax 11
==
θ (11.6)
i
N
⎪Σ =≥∀=
⎪ ⎩ ⎭ 1, 0, 1, ...
λ λ kk k kN
= 1
y
SUB
θ j son idénticos, y cada uno recupera la distribución de la verdadera
ineficiencia de entrada θ .
La discusión anterior conduce a las siguientes pruebas de la hipótesis nula
de separabilidad en la utilización de las entradas en oposición a la alternativa
de sustituibilidad de las entradas:
(i) Si ln (θ j ) se distribuye exponencialmente sobre [0, ∞ ), a continuación,
bajo la hipótesis nula de separabilidad de los insumos, la estadística de
prueba se calcula como NN septiembre SUB
Σ Σj y evaluado con respecto al valor crítico de la media
ln
() ln ()
θθ
j
jj
==
11
t
entrada x t y = φ (xt), t = 0,1 (11.7) *
t, se representa como
jr y
() N
j g , para el
ln
11 0 0 / () ln / () jj jj yy φ φ x - x
r=
j {() ()} 10
() N
ln
11 0 0 / () ln / () jj jj yy φ φ x - x (11.9)
g=
j {() ()} 00
() N
7
El tratamiento del cambio de productividad en esta sección proporciona una alternativa a los
tratamientos que utilizan el índice de Malmquist descrito en el capítulo 5 y, además, tiene
la ventaja de proporcionar caracterizaciones estadísticas explícitas.
8
La variable aleatoria de eficiencia relativa y la medida de ineficiencia están vinculadas por la
α
relación = -ln ( ). tt θ αt t θ
ˆ, 1, ...;
Λλ
y xxi
00
kkk ik ij
kk
00000
j0 () 0 φ x = argmax 11==
1, 0, 1, ...
k
λλ k
00
kN
= 0 k0
1 j1 φ)(se x
j0 () 0 φ x 1j1 φ () x 0(xj0)y
de período 1. y son estimadores consistentes de φ
φ1(xj1), respectivamente, (Banker 1993).
El valor de la frontera del período base, φ0(xj1), correspondiente a la
período 1 entrada del, xj1, se estima con base en el siguiente programa lineal:
⎧⎫ ≥ φ; ≤ ∀ = ⎪ ⎪ φ⎪ ⎪ =≥∀= I
∑∑ ⎨⎬ ∑ ⎩ ⎭ (11.11)
NN
ˆ, 1, ...;
Λλ
yx xi
00
kkk ik ij
kk
00001
j1 () φ x = argmax
0 11==
1, 0, 1, ...
k
λλ k
00
kN
= 0 k0
1
= Argmin MD b (N)
(N)
∑-
j= j
1
1
| rr | NN
∑-
MD (N)
rˆ = argmin (N)
j= j
1
1
| gg | NN
∑ - (11.12)
MD (N)
gˆ = argmin (N)
j= j
1
r y () MD N
j
j g sonconsistentes
jr y
() N
j g , respectivamente, es
()N
1ˆˆ yy
N ln / ( ) ln / ( ) jj jj N φ φ xx −
N jφ φ =∑ xx − j1 1 1
j
r=
()
ˆN { ( )( )} 10
11 0 0
1ˆˆ yy
ln / ( ) ln / ( ) jj jj N φ φ x − x (11.13)
=
()
ˆ Ng { ( )( )} 00
11 0 0
ˆ
Next consider the statistics = (N) t () β( )ˆ( ) N
ˆ l( )
Nrs ρ and = t () γ ˆ( )
(N)
N
ˆ
= (N) t () ρ( )ˆ( ) N Ngs γ where
⎛⎞⎛⎞ −−⎜⎟⎝⎠
⎜⎟∑ ⎝⎠
2 ()
2 10
xx −
ˆˆ N ˆ
11
1 ln( ( )) ln( ( )) 1 N s ()()
2 ()
(β) = 2 2 10
⎛⎞⎛⎞ −−− N⎝
jj
φ φ Nb N =
j ⎜⎟∑ ⎜⎟ xx
ˆˆ N
⎠ 11 0 0
1 ln( / ( )) ln( / ( )) 1 N
⎝⎠
ˆ
s ()()
2
(ρ) = 2 2()
N
⎛⎞⎛⎞ −−⎜⎟⎝⎠ N
jj jj
j yyN φ φ r = ⎜⎟∑ ⎝
⎠
(γ) = ˆˆ
sˆ ( ) ( )( ) l ( ) 11 0 0
1 ln / ( ) ln / ( ) 1
xx N − (11.14)
jj jj
y yN φ φ g =
j
00
2 ˆ
(N)
t () γ
= g(xj) – yj. Thus, the deviation is modeled as the sum of two components, a one-
sided inefficiency term, uj, and a two-sided random noise term vj bounded above
at VM, analogous to composed error formulations in parametric stochastic
frontier models (Aigner et al. 1977, Meussen and van den Broeck 1977, Banker
and Natarajan 2001). In this stochastic framework, Banker and Natarajan (2003)
propose two statistical tests to compare the efficiency of two groups of DMUs.
As before, consider two sub-samples, G1 and G2, that are part of the sample of N
DMUs when the sample size, N, is large. Let the true inefficiency, uj, be
distributed with means 1 u and 2 u in the two groups. Further assume that the
ˆ
variance of the inefficiency is the same in both u
groups. Define j u = VM – vj + uj. We can estimate j , a consistent u
estimator of j , by applying DEA on input and output data from the full
sample of N DMUs. For N 1 and N2 DMUs in subgroups G1 and G2,
respectively, the null hypothesis of no difference in mean inefficiency between
ˆ
the two subgroups can be tested using the following procedures: u 0 + a1zj + ej
estimated using a total
(i) Consider the OLS regression = a j
of N1+N2 DEA inefficiency scores. zj is a dummy variable that takes a value of 0
if a particular DMU belongs to group G1 and 1 if it belongs to G2 and ej is an iid
error term. The regression coefficient l1 a is a consistent estimator of 2 u - 1 u , the
difference in mean inefficiency between groups G 2 and G1. The t-statistic
associated with this regression coefficient can be used to evaluate whether two
groups are significantly different in terms of mean inefficiency.
(ii) Assume that the probability distributions of the inefficiency random
variable uj and the noise random variable v j are such that u j = VM – vj + uj is
distributed as a log-normal variable in the two groups. Under the null hypothesis
that the mean inefficiencies are equal ie, 1 u = 2 u and assuming
ˆ
t
11
that the variance of uj is the same in the two groups, the Student-t statistic
ˆ lu lu S
NN
⎛⎞−⎜⎟
⎝ ⎠ + distributed with (N1+N2-2) degrees of freedom
m
m
j j
=
12
12
1 ˆ ln(u )
can be used to evaluate the null hypothesis of no difference in mean
m
NNj=∑ , j 2 lu = 2j2 1 2
jm 1 ˆ ln(u ) N
inefficiency across the two groups. 1 N j=∑
lu is 1
1j1 1
0.5
⎧⎫ ⎧ ⎫⎧ ⎫ ⎜ ⎟
⎛⎞ ⎪⎪ ⎨ ⎨ ⎬ ⎨ ⎬⎬ ∑ ∑ −+ −
m 2 2 NN
1 ˆ ˆ ln(u ) lu ln(u ) lu
NN2 jj = =
ˆ m
and = S 1 2 j j
.
+− ⎩ ⎭⎩ ⎭
j1 1 j2 2 1 1
12 ⎪⎪ ⎝⎠⎩⎭
Consider the case where h(z) = h(z;β) and h(z;β) is a non-negative function,
monotone increasing in z, linear in β. In this case, the impact of contextual
variables can be consistently estimated by regressing the first stage DEA
ˆ
estimate δ j
on the various contextual variables associated with
the various components of the β vector. This procedure yields consistent
estimators of the parameter vector β. In the special case where h(z;β) = N
, the independent variables in the regression are the same as
∑
j
z'β = zβ =
1 jj
λδ ψ λ zzi S
kkk ik ij
kk
ˆψ j = argmin 1 1
==N
ψ (11.17)
⎪⎪ = ≥ ∀=
∑ ⎩ ⎭ 1, 0, 1,...
λ λ kk k kN
= 1
λδ ψ λ zzi ss S
kkk ik ij
kk
ˆ s ψ j− = argmin 1 1
==N
ψ (11.18)
⎪⎪ = ≥ ∀=
∑ ⎩⎭
kN
1, 0, 1,...
λλ
kk
k
=
1 ˆ
j ε − = ˆ js δ j ψ− − . Since (11.18) is a
Let the resulting estimator of j ε be ˆ s
Under the null hypothesis that the marginal impact of zs (ie ∂h(z)/∂zs if h(.) is
differentiable) is zero, the asymptotic distributions of ε and s ε− are identical
(Banker 1993). If the asymptotic distribution of j ε is assumed to be exponential
or 2 2
or half-normal, the null hypothesis of no impact of zs is tested ∑ ∑
ˆ ˆ NN s ˆ NN s ˆ
by comparing the ratios ⎡⎤⎡⎤ jε ε
−
∑ ∑ ⎣ ⎦ ⎣ ⎦ j
ε ε − jj jj = = jj
11
against critical ==
11
j ε − and
j ε , can also be used to check whether the empirical distributions of ˆ s
ˆˆ jε
−
and
j ε are significantly different. If they are significantly different, then it can be
established that zs has a significant impact on productivity.
λλ
y xxi I
y , 1,... ;
kkk ik ij
kk
ˆ
( ) DEAj g X = argmax 1 1
==N
y (11.20)
⎪⎪ = ≥ ∀=
∑ ⎩⎭
λλ kN
1, 0, 1,...
kk
k
= 1
An estimator for j ε for each observation in the sample can then be obtained
ˆ
as ˆ ln( ( )) ln( ) DEA
DEA
ˆ DEA
jj ε = − gX y j . Further, ( ) j g X and ˆ
DEA
j ε are
where J is a given set of observations. Based on these results, they suggest the
following four tests for testing the adequacy of the parametric functional form:
20 Chapter 11: Statistical Tests Based on DEA Efficiency Scores
(a) The first test uses the Kolmogorov-Smirnov test statistic given by the
ˆ DEA ˆ PARAM
maximum vertical distance between ˆ ( F j ε and , where ˆ ( F jε )
)
ˆ DEA ˆ PARAM
) ˆ ( F j ε and denote the empirical distributions of ˆ ( F j ε ) ˆ DEA
j ε and
ˆ PARAM
jε respectively. A low value is indicative of support for the null hypothesis that
g X(;) β adequately represents g( ) X .
(b) The second procedure is based on the regression of rank of ˆ
DEA
j ε on
the rank of ˆ
PARAM
j ε (Iman and Conover 1979). Under the null hypothesis that the
variate for large samples and a high absolute value of C rejects the adequacy of
the parametric functional form.
Banker et al. (2002) also propose an alternative approach to evaluating the
adequacy of a parametric functional form. The approach suggested by them relies
on Wooldridge's (1992) Davidson-Mackinnon type test to evaluate a linear null
model against a nonparametric alternative. Banker et al. (2002) propose the use
of a sieve DEA estimator as the nonparametric alternative for the purposes of
Wooldridge's test since the test cannot be applied directly when the
nonparametric alternative is based on the traditional DEA estimator. Interested
readers are referred to section 2.3 of Banker et al. (2002) for additional details on
how Wooldridge's test can be applied to examine the adequacy of a specified
parametric form for a monotone and concave function.
RD Banker and R. Natarajan
21
5. CONCLUDING REMARKS
Hemos descrito aquí varias pruebas estadísticas que pueden utilizarse para
probar hipótesis de interés y relevancia para los usuarios aplicados del Análisis
Envolvente de Datos. Un tema común subyacente a estas pruebas es que la
desviación de la frontera del DEA puede verse como una variable estocástica.
Mientras que el estimador del DEA está sesgado en muestras finitas, el valor
esperado del estimador del DEA es casi seguro el verdadero valor del parámetro
en muestras grandes. Las pruebas descritas en este documento se basan en esta
propiedad asintótica del estimador DEA.
Una advertencia importante es que las pruebas descritas en este documento
están diseñadas para muestras grandes. Los resultados de los estudios de
simulación realizados sobre muchas de las pruebas propuestas en este estudio
sugieren que estas pruebas funcionan muy bien para tamaños de muestra
similares a los utilizados en muchas aplicaciones típicas de DEA. Estas pruebas
deben utilizarse con precaución en muestras pequeñas. Creemos que es necesario
realizar más estudios de simulación para aportar pruebas sobre el rendimiento de
las pruebas aquí descritas en muestras pequeñas. Está claro que se trata de un
área importante para la investigación futura.
Creemos que hay muchas más vías y áreas en las que se pueden aplicar las
pruebas estadísticas basadas en DEA. Esto se debe a que la estructura flexible de
DEA facilita la aplicación en un gran número de situaciones en las que la falta de
información u orientación puede impedir el uso de métodos paramétricos. Las
pruebas estadísticas desarrolladas durante los últimos 10 años han contribuido
significativamente a la fiabilidad de las implicaciones políticas y de gestión de
los estudios de DEA y creemos que seguirán enriqueciendo las futuras
aplicaciones de DEA.
REFERENCES
1. Aigner, DJ, Lovell, CAK and Schmidt, P., 1977. Formulation and Estimation
of Stochastic Frontier Production Function Models. Journal of
Econometrics, 6, 21-37.
2. Anderson, P., and Petersen, NC, 1993. A Procedure for Ranking Efficient
Units in Data Envelopment Analysis. Management Science 39, 1261-1264.
3. Banker, RD, 1984. Estimating Most Productive Scale Size Using Data
Envelopment Analysis. European Journal of Operations Research, July,
35-44.
9
Banker (1996) provides details on some of these simulation studies. Based on the results of
these studies, it appears that the tests described in this paper perform well in sample sizes
of the order of 50 or more.
https://www.ugr.es/~erivera/PaginaDocencia/Posgrado/Documentos/ClementeC
uadernoInferencial.pdf