Ormeo Elementos Cuantitativos 22dic2016 Online

Elementos Cuantitativos de
Investigación en las Ciencias Sociales.
Héctor Ormeño Campos
22 de diciembre, 2016
1
Registro de Propiedad Intelectual N° A-273337
Héctor Ormeño Campos
Diciembre 2016, Santiago de Chile.
2
Contenido
1. Dimensión cuantitativa de los fenómenos sociales..................................................................................... 5

2. Dimensión cuantitativa en los órganos del sector público. ........................................................................ 5
3. Las matemáticas necesarias. ...................................................................................................................... 5
3.1. Fracciones. .............................................................................................................................................. 5
3.2. Exponentes............................................................................................................................................... 7
3.3. Exponentes Fraccionarios. ...................................................................................................................... 7
3.4. Operaciones algebraicas. ........................................................................................................................ 8
3.5. Factorización......................................................................................................................................... 10
3.6. Ecuaciones............................................................................................................................................. 11
3.7. Funciones. ............................................................................................................................................. 14
3.8. Derivadas. ............................................................................................................................................. 20
4. Estadística Descriptiva ............................................................................................................................. 29
4.1. Introducción .......................................................................................................................................... 29
4.1.1. Tipos de Variables ...................................................................................................................... 29
4.1.2. Algunas herramientas de medición............................................................................................. 29
4.1.3. Distribuciones en la organización de datos............................................................................... 31
4.1.4. Rango Percentil. ......................................................................................................................... 32
4.2. Medidas de tendencia central: ........................................................................................................ 33
4.2.1. Medidas de Tendencia Central en Frecuencias de Distribución Simple .................................... 35
4.2.2. Medidas de Tendencia Central en Datos Agrupados. ................................................................ 36
4.3. Medidas de dispersión: ................................................................................................................... 37
4.3.1. Medidas de Dispersión Frecuencias de Distribución Simple. .................................................... 39
4.3.2. Medidas de Dispersión en Datos Agrupados.............................................................................. 41
4.4. Distribución normal. ....................................................................................................................... 41
4.4.1. Probabilidades en la curva normal. ........................................................................................... 43
4.5. Otros conceptos de relevancia en la Estadística Descriptiva. ........................................................ 44
5. Medidas de Asociación. ............................................................................................................................ 49
5.1. Intuición de las medidas de asociación. ......................................................................................... 49
5.2. Estadísticos de asociación (Covarianza, Coef. de Correlación). ................................................... 49
5.2.1. Covarianza ................................................................................................................................. 50
5.2.2. Coeficiente de Correlación ......................................................................................................... 52
5.3. Otros estadísticos de asociación. .................................................................................................... 57
5.3.1. Coeficiente de correlación de Spearman ........................................................................................ 57
5.3.2. Aplicaciones con medidas de asociación. ....................................................................................... 59
6. Elementos de Inferencia Estadística ......................................................................................................... 62
6.1. El porqué del uso de muestras. ....................................................................................................... 62
6.2. Métodos de Muestreo. ..................................................................................................................... 62
6.3. Error de muestreo. .......................................................................................................................... 63
6.4. Distribución normal en la inferencia. ............................................................................................. 63
3
6.5. Error estándar de la media. ............................................................................................................ 64
6.6. Estimación de proporciones............................................................................................................ 64
7. Test de Hipótesis. ..................................................................................................................................... 67
7.1. Test estadísticos relevantes ............................................................................................................. 67
7.2. Test de Diferencia de Medias.......................................................................................................... 67
7.2.1. Test de Diferencia de Medias: muestras pequeñas..................................................................... 69
7.2.2. Test de Diferencia de Medias: tamaños muestrales distintos. .................................................... 69
7.3. Test Chi cuadrado ........................................................................................................................... 70
8. La Programación Lineal. ......................................................................................................................... 73
8.1. Problema de Programación Lineal. ...................................................................................................... 73
8.2. Solución con Método Gráfico. ............................................................................................................... 73
9. Introducción al Modelo de Regresión Lineal. .......................................................................................... 79
9.1. Modelo de Mínimos Cuadrados Ordinarios (MCO) ............................................................................. 79
9.2. Supuestos del MCO. .............................................................................................................................. 80
9.3. Estimación por MCO. ............................................................................................................................ 80
10. Modelo de Regresión Lineal: Ajuste e Inferencia. ................................................................................... 84
10.1. Bondad de Ajuste (R2).......................................................................................................................... 84
10.2. Test estadísticos. .................................................................................................................................. 85
10.2.1. Test de hipótesis: Coeficientes individuales. ................................................................................ 85
10.2.2. P-value.......................................................................................................................................... 86
11. Modelo de Regresión Multivariado. ......................................................................................................... 89
11.1. Test de hipótesis: Significancia Global. .............................................................................................. 89
11.2. Test de Significancia Global: fórmula alternativa. ............................................................................. 90
11.4. Otras formas funcionales..................................................................................................................... 92
4
1. Dimensión cuantitativa de los fenómenos sociales.
¿Por qué dimensión? En este curso llamaremos dimensión cuantitativa de los fenómenos sociales a
todo aquello que podemos medir respecto a un fenómeno de interés que sucede entre las personas,
en los grupos, y en la sociedad, y que se estudia debido a la relevancia que tiene en los últimos. Aún
cuando no se puedan medir directamente dichos fenómenos, es posible encontrar una forma de
cuantificar su evolución (Proxy).
¿Por qué medir? Es importante medir si el fenómeno es de relevancia, por sus consecuencias sobre
la vida de las personas, grupos, y/o sociedad. A su vez, al medir, podemos comprender el
comportamiento de dicho fenómeno, sus particularidades, y ver cómo cambia a partir de la
interacción con otros fenómenos.
Un estado superior del medir es la conformación del modelo, como una interrelación cuantitativa
entre diferentes variables. El modelo proviene de la teoría y su testeo empírico. Este modelo es una
propuesta para comprender el fenómeno, por lo que no quiere decir que corresponde a la verdad
absoluta.
2. Dimensión cuantitativa en los órganos del sector público.
La disciplina de la administración pública se nutre de distintas vertientes entre las que se tiene el
derecho, la economía, las finanzas, la ciencia política, entre otras, algunas de las cuales tiene una
fuerte vertiente de carácter cuantitativo. A su vez, esta dimensión se observa tanto al interior como
en el exterior de los órganos de la administración del estado. En el interior es necesario llevar el
control de las finanzas, efectuar control de gestión, analizar los insumos y elegir la mejor
combinación para llevar a cabo proyectos. En el exterior existe información de suma relevancia,
pues consiste en información que permite dilucidar la demanda por recursos públicos, bienes
públicos y regulaciones, entre otros.
3. Las matemáticas necesarias.
Esta sección considera a grandes rasgos algunos elementos matemáticos necesarios para
comprender la estadística. Entre estos se encuentran las fracciones, exponentes, ecuaciones,
funciones y derivadas, entre otros, elementos importantes en la estadística y las herramientas
cuantitativas en general. Gran parte de este capítulo se basa en Arya et al (2009). Los ejercicios y
ejemplos son citados cuando corresponden a Arya et al, u a otra obra. El objetivo es invitar al lector
a profundizar el conocimiento específico en dichos libros.
3.1. Fracciones.
Una fracción se define como el producto de a y el inverso de b (Arya et al, 2009), esto es:
𝑎𝑎
𝑏𝑏
= 𝑎𝑎𝑏𝑏 −1 donde 𝑏𝑏 ≠ 0 (3.1)
Se pueden realizar una serie de operaciones con las fracciones, las que se definen a continuación.
Multiplicación de fracciones.
𝑎𝑎 𝑐𝑐 𝑎𝑎𝑎𝑎
𝑏𝑏
× 𝑑𝑑 = 𝑏𝑏𝑏𝑏
5
División de fracciones.
𝑎𝑎 𝑐𝑐 𝑎𝑎 𝑑𝑑 𝑎𝑎𝑎𝑎
𝑏𝑏
÷ 𝑑𝑑 = 𝑏𝑏
× 𝑐𝑐 = 𝑏𝑏𝑏𝑏
Cancelación de factores comunes.

𝑎𝑎𝑎𝑎 𝑎𝑎
𝑏𝑏𝑏𝑏
= 𝑏𝑏
Adición y sustracción.
𝑎𝑎 𝑏𝑏 𝑎𝑎+𝑏𝑏
𝑐𝑐
+ 𝑐𝑐 = 𝑐𝑐
𝑎𝑎 𝑏𝑏 𝑎𝑎−𝑏𝑏
𝑐𝑐
− 𝑐𝑐 = 𝑐𝑐
𝑎𝑎 𝑏𝑏 𝑎𝑎𝑎𝑎+𝑏𝑏𝑏𝑏
𝑐𝑐
+ 𝑑𝑑 = 𝑐𝑐𝑐𝑐
𝑎𝑎 𝑏𝑏 𝑎𝑎𝑎𝑎−𝑏𝑏𝑏𝑏
𝑐𝑐
− 𝑑𝑑 = 𝑐𝑐𝑐𝑐
Ejemplos: A continuación se revisan algunos ejemplos de operaciones con fracciones (Budnick,

2007: A-16), donde la expresión a la izquierda del signo igual corresponde al ejercicio propuesto.
5 3 100+24 124 4𝑥𝑥31 31

a) + = = = =
8 20 160 160 4𝑥𝑥40 40
3 5 18𝑥𝑥 2 −20𝑥𝑥 9𝑥𝑥−10

b)
4𝑥𝑥
− 6𝑥𝑥 2 = 24𝑥𝑥 3
= 12𝑥𝑥 2
Sin embargo la última expresión también se puede resolver acudiendo al mínimo común
denominador, el que corresponde en este caso a 12𝑥𝑥 2 . De esta forma:
3 5 9𝑥𝑥−10
4𝑥𝑥
− 6𝑥𝑥 2 = 12𝑥𝑥 2
3 5𝑥𝑥 𝑥𝑥 2 3 5𝑥𝑥 𝑥𝑥 2
c)
𝑥𝑥−1
− 𝑥𝑥+1 + 𝑥𝑥 2 −1 = 𝑥𝑥−1 − 𝑥𝑥+1 + (𝑥𝑥+1)(𝑥𝑥−1)
3(𝑥𝑥+1)−5𝑥𝑥(𝑥𝑥−1) 𝑥𝑥 2 3(𝑥𝑥+1)−5𝑥𝑥(𝑥𝑥−1)+𝑥𝑥 2 3𝑥𝑥+3−5𝑥𝑥 2 +5𝑥𝑥+𝑥𝑥 2

= (𝑥𝑥−1)(𝑥𝑥+1)
+ (𝑥𝑥+1)(𝑥𝑥−1) = (𝑥𝑥−1)(𝑥𝑥+1)
= (𝑥𝑥+1)(𝑥𝑥−1)
−4𝑥𝑥 2 +8𝑥𝑥+3 −4𝑥𝑥 2 +8𝑥𝑥+3

= (𝑥𝑥+1)(𝑥𝑥−1)
= 𝑥𝑥 2 −1
𝑥𝑥−1 15 (𝑥𝑥−1)15 (𝑥𝑥−1)3 3

d)
10 𝑥𝑥 2 −1
= (𝑥𝑥 2 −1)10 = (𝑥𝑥−1)(𝑥𝑥+1)2 = 2(𝑥𝑥+1)
−5
5 4 20 5
e) 12
3 =− =− =−
12 3 36 9
4
6
(3𝑥𝑥 2 /4) 3𝑥𝑥 2 2 𝑥𝑥 1 𝑥𝑥
f) = = =
(9𝑥𝑥/2) 4 9𝑥𝑥 32 6
2
1− (𝑥𝑥−2) 𝑥𝑥 𝑥𝑥−2
g) 4
𝑥𝑥
= =
𝑥𝑥 4 4
𝑥𝑥
3.2. Exponentes.
De acuerdo a Arya et al (2009), “si m es un entero positivo, entonces 𝑎𝑎𝑚𝑚 se define como el producto
de m factores a multiplicados a la vez”, esto es:
𝑎𝑎𝑚𝑚 = 𝑎𝑎 × 𝑎𝑎 × 𝑎𝑎 × … × 𝑎𝑎 (3.2)
Donde a corresponde a la base y m al exponente, esto es, en 23, 2 es la base, 3 el exponente, y el

resultado es 23=2x2x2=8. Las propiedades de los exponentes se detallan a continuación.
Propiedad 1.
𝑎𝑎𝑚𝑚 𝑎𝑎𝑛𝑛 = 𝑎𝑎𝑚𝑚+𝑛𝑛
Propiedad 2.
𝑎𝑎 𝑚𝑚
𝑎𝑎 𝑛𝑛
= 𝑎𝑎𝑚𝑚−𝑛𝑛 siempre que 𝑎𝑎 ≠ 0
Propiedad 3.
(𝑎𝑎𝑚𝑚 )𝑛𝑛 = 𝑎𝑎𝑚𝑚𝑚𝑚
Propiedad 4.
(𝑎𝑎𝑎𝑎)𝑚𝑚 = 𝑎𝑎𝑚𝑚 𝑏𝑏 𝑚𝑚
Propiedad 5.
𝑎𝑎 𝑚𝑚 𝑎𝑎 𝑚𝑚
� � = 𝑏𝑏𝑚𝑚
𝑏𝑏
3.3. Exponentes Fraccionarios.
De acuerdo a Arya et al (2009), se tiene un exponente fraccionario cuando la base está elevada a
una fracción, esto es:
𝑚𝑚 1 𝑚𝑚
𝑎𝑎 𝑛𝑛 = �𝑎𝑎𝑛𝑛 �
Donde n es un entero positivo, m un entero distinto de cero y a un número real.
7
Teorema.
𝑚𝑚 𝑚𝑚
Si existe 𝑎𝑎 𝑛𝑛 , entonces 𝑎𝑎 𝑛𝑛 = (𝑎𝑎𝑚𝑚 )1/𝑛𝑛 (3.3)
Ejemplos de exponentes: A continuación se presentan algunos ejemplos de exponentes y exponentes

fraccionarios, incluyendo operaciones con radicales (Budnick, 2007: A-19).
2
a) √4 = 4
b) √9 = 3
3 3 3
c) √−27 = �(−1)3𝑥𝑥3𝑥𝑥3 = �(−1)33 = −3
5
d) √−243 = −3
1 4
e) �𝑥𝑥 2 � = 𝑥𝑥 2
5
5 3 20−24 1
𝑥𝑥 8 1
f) 3 = 𝑥𝑥 8 − 4 = 𝑥𝑥 32 = 𝑥𝑥 − 8 = 1
𝑥𝑥 4 𝑥𝑥 8
2 −3 6
1
g) �𝑥𝑥 3 � = 𝑥𝑥 −3 = 𝑥𝑥 −2 =
𝑥𝑥 2
3 3
h) �√−8� = −8
3 (−1) 1
i) � =−
125 5
1
1 1 1
j) 49− 2 = = =
√49 √72 7
3.4. Operaciones algebraicas.
Las expresiones algebraicas están compuestas por términos, los cuales a su vez están compuestos
por coeficientes y partes literales. Por ejemplo, la expresión 2x3+ 4x4, está compuesta por dos
términos, el primero de los cuales tiene como coeficiente 2, y parte literal x3.
Una expresión algebraica puede compuesta por un término (monomio), dos términos (binomio), o
tres términos (trinomio). Generalizando, una expresión con más de un término es un multinomio
(Arya et al, 2009).
Adición y sustracción.
𝑎𝑎𝑎𝑎 + 𝑏𝑏𝑏𝑏 = 𝑥𝑥(𝑎𝑎 + 𝑏𝑏)
𝑎𝑎𝑎𝑎 − 𝑏𝑏𝑏𝑏 = 𝑧𝑧(𝑎𝑎 − 𝑏𝑏)
Multiplicación de expresiones
𝑎𝑎(𝑥𝑥 + 𝑦𝑦) = 𝑎𝑎𝑎𝑎 + 𝑎𝑎𝑎𝑎
(𝑎𝑎 + 𝑏𝑏)(𝑥𝑥 + 𝑦𝑦) = 𝑎𝑎𝑎𝑎 + 𝑎𝑎𝑎𝑎 + 𝑏𝑏𝑏𝑏 + 𝑏𝑏𝑏𝑏
La multiplicación de expresiones nos permite considerar ciertos productos frecuentes, denominados

“productos notables”, tales como:
8
(𝑥𝑥 + 𝑎𝑎)(𝑥𝑥 + 𝑏𝑏) = 𝑥𝑥 2 + (𝑎𝑎 + 𝑏𝑏)𝑥𝑥 + 𝑎𝑎𝑎𝑎
(𝑥𝑥 + 𝑎𝑎)(𝑥𝑥 + 𝑎𝑎) = (𝑥𝑥 + 𝑎𝑎)2 = 𝑥𝑥 2 + 2𝑎𝑎𝑎𝑎 + 𝑎𝑎2 (Binomio suma al cuadrado)
(𝑥𝑥 − 𝑎𝑎)(𝑥𝑥 − 𝑎𝑎) = 𝑥𝑥 2 − 2𝑎𝑎𝑎𝑎 + 𝑎𝑎2 (Binomio diferencia al cuadrado)
(𝑥𝑥 + 𝑎𝑎)(𝑥𝑥 − 𝑎𝑎) = 𝑥𝑥 2 − 𝑎𝑎2 (Suma por la diferencia)
(𝑥𝑥 + 𝑎𝑎)3 = 𝑥𝑥 3 + 3𝑥𝑥 2 𝑎𝑎 + 3𝑥𝑥𝑎𝑎2 + 𝑎𝑎3 (Binomio suma al cubo)

= 𝑥𝑥 3 + 𝑎𝑎3 + 3𝑥𝑥𝑥𝑥(𝑥𝑥 + 𝑎𝑎)
(𝑎𝑎 − 𝑏𝑏)3 = 𝑎𝑎3 − 3𝑎𝑎2 𝑏𝑏 + 3𝑎𝑎𝑏𝑏 2 − 𝑏𝑏 3 (Binomio diferencia al cubo)
𝑎𝑎3 + 𝑏𝑏 3 = (𝑎𝑎 + 𝑏𝑏)(𝑎𝑎2 − 𝑎𝑎𝑎𝑎 + 𝑏𝑏 2 ) (Suma de cubos)
𝑎𝑎3 − 𝑏𝑏 3 = (𝑎𝑎 − 𝑏𝑏)(𝑎𝑎2 + 𝑎𝑎𝑎𝑎 + 𝑏𝑏 2 ) (Diferencia de cubos)
La factorización nos lleva a formular productos más complejos, como los siguientes:
𝑎𝑎4 − 𝑏𝑏 4 = (𝑎𝑎2 − 𝑏𝑏 2 )(𝑎𝑎2 + 𝑏𝑏 2 ) = (𝑎𝑎 − 𝑏𝑏)(𝑎𝑎 + 𝑏𝑏)(𝑎𝑎2 + 𝑏𝑏 2 )
𝑎𝑎5 + 𝑏𝑏 5 = (𝑎𝑎 + 𝑏𝑏)(𝑎𝑎4 − 𝑎𝑎3 𝑏𝑏 + 𝑎𝑎2 𝑏𝑏 2 − 𝑎𝑎𝑏𝑏 3 + 𝑏𝑏 4 )
𝑎𝑎4 + 𝑏𝑏 4 = (𝑎𝑎2 + √2𝑎𝑎𝑎𝑎 + 𝑏𝑏 2 )(𝑎𝑎2 − √2𝑎𝑎𝑎𝑎 + 𝑏𝑏 2 )
División de expresiones
La división de expresiones se puede ejemplificar a través del siguiente ejercicio, donde 𝑐𝑐 ≠ 0.
𝑎𝑎+𝑏𝑏 𝑎𝑎 𝑏𝑏
= +
𝑐𝑐 𝑐𝑐 𝑐𝑐
𝑎𝑎−𝑏𝑏 𝑎𝑎 𝑏𝑏
= −
𝑤𝑤 𝑤𝑤 𝑤𝑤
Sin embargo, en la realidad pueden existir divisiones de mayor complejidad. Supongamos, de

acuerdo a Arya et al (2009), que pretendo dividir 23 − 11𝑥𝑥 2 + 2𝑥𝑥 3 en 2𝑥𝑥 − 3. La metodología a
seguir es la siguiente. En primer lugar, se debe ordenar el dividendo de forma descendente, al igual
que el divisor, de la forma:
(2𝑥𝑥 3 − 11𝑥𝑥 2 + 0𝑥𝑥 + 23) ÷ (2𝑥𝑥 − 3)
Para solucionar dicha división hay que seguir una serie de pasos, que se detallan a continuación.
a. Primero se debe dividir el primer término del dividendo por el primer término del divisor,
2𝑥𝑥 3
lo que da como resultado = 𝑥𝑥 2 , y que corresponde al primero término de la línea (1).
2𝑥𝑥
b. En segundo lugar, se debe multiplicar el 𝑥𝑥 2 por el primer termino del divisor, 𝑥𝑥 2 × 2𝑥𝑥 =
2𝑥𝑥 3 , que es el primer término de la línea (3), y luego 𝑥𝑥 2 por el segundo término del divisor,
𝑥𝑥 2 × (−3) = −3𝑥𝑥 2 , que es el segundo termino de la línea (3).
9
c. A continuación se le resta a la línea (2) la línea (3), dando como resultado la línea (4):
0 − 8𝑥𝑥 2 + 0𝑥𝑥 + 23.
d. A continuación, se debe dividir el primer término de la línea (4) por el primer término del
−8𝑥𝑥 2
divisor, dando como resultado 2𝑥𝑥 = −4𝑥𝑥, y que corresponde al segundo término de la
línea (1).
e. A continuación, se debe multiplicar -4x por el primer término del divisor, −4𝑥𝑥 × 2𝑥𝑥 =
−8𝑥𝑥 2, que es el primer termino de la línea (5), y luego −4𝑥𝑥 por el segundo término del
divisor, −4𝑥𝑥 × (−3) = 12𝑥𝑥, que es el segundo término de la línea (5), y el proceso de la
misma forma hacia adelante.
𝑥𝑥 2 − 4𝑥𝑥 − 6 U (1)
(2𝑥𝑥 − 3)|2𝑥𝑥 3 − 11𝑥𝑥 2 + 0𝑥𝑥 + 23 (2)
2𝑥𝑥 3 − 3𝑥𝑥 2 (3)
0 − 8𝑥𝑥 2 + 0𝑥𝑥 + 23 U (4)
−8𝑥𝑥 2 + 12𝑥𝑥 U (5)
0 − 12𝑥𝑥 + 23 (6)
−12𝑥𝑥 + 18 U (7)
0 + 5 (8)
Una vez realizado el proceso, la solución es igual a la siguiente expresión, donde el coeficiente se
divide por uno, y el residuo (que es 5 en este caso) se divide por el divisor.
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅
= 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 + (3.4)
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷
�2𝑥𝑥 3 −11𝑥𝑥 2 +0𝑥𝑥+23� 5

(2𝑥𝑥−3)
= 𝑥𝑥 2 − 4𝑥𝑥 − 6 + (2𝑥𝑥−3)
3.5. Factorización.
A continuación revisaremos algunas estrategias útiles de factorización, las que por su carácter
general, pueden ser de gran utilidad.
Ejemplo 1: Suponga la siguiente expresión, 𝑥𝑥 2 − 2. Una forma de factorizar dicha expresión es la

siguiente, donde como se verá, se plante la diferencia como una suma por diferencias.
𝑥𝑥 2 − 2 = 𝑥𝑥 2 − √22 = �𝑥𝑥 − √2�(𝑥𝑥 + √2)
Ejemplo 2: Es usual encontrarse con expresiones como la siguiente, en la cual la factorización es

directa.
𝑥𝑥 2 + 3𝑥𝑥 + 2 = (𝑥𝑥 + 1)(𝑥𝑥 + 2)

𝑥𝑥 2 − 3𝑥𝑥 + 2 = (𝑥𝑥 − 1)(𝑥𝑥 − 2)
𝑥𝑥 2 + 2𝑥𝑥 − 3 = (𝑥𝑥 + 3)(𝑥𝑥 − 1)
Como se puede observar, la resolución de estas factorizaciones es una consecuencia directa del
producto notable (𝑥𝑥 + 𝑎𝑎)(𝑥𝑥 + 𝑏𝑏) = 𝑥𝑥 2 + (𝑎𝑎 + 𝑏𝑏)𝑥𝑥 + 𝑎𝑎𝑎𝑎. En el primer caso (a + b) es igual a
1+2=3, mientras que ab es igual a 2.
10
Ejemplo 3: Sin embargo, a veces nos podemos encontrar con factorizaciones más complejas, como
es el caso de:
3𝑥𝑥 2 + 11𝑥𝑥 + 6
Como se puede observar, en este caso la ecuación surge de la forma más general:
𝑚𝑚𝑚𝑚 2 + 𝑝𝑝𝑝𝑝 + 𝑞𝑞
Donde m, p y q son constantes distintas de cero y 𝑚𝑚 ≠ 1 o −1. Para solucionar este problema, la
clave es encontrar dos factores del producto mq que sumen p. En este caso mq=3x6=18, y dos
factores de mq que sumen p pueden ser 9x2=18. Ahora, se procede de la siguiente forma:
3𝑥𝑥 2 + (9 + 2)𝑥𝑥 + 6
3𝑥𝑥 2 + 9𝑥𝑥 + 2𝑥𝑥 + 6
3𝑥𝑥(𝑥𝑥 + 3) + 2(𝑥𝑥 + 3)
(3𝑥𝑥 + 2)(𝑥𝑥 + 3)
3.6. Ecuaciones.
Una ecuación “es una proposición que expresa la igualdad de dos expresiones algebraicas” (Arya et
al, 2009). Ejemplos de ecuaciones son:
2𝑥𝑥 − 3 = 9 − 𝑥𝑥
𝑦𝑦 2 − 5𝑦𝑦 = 6 − 4𝑦𝑦
𝑎𝑎
= 𝑠𝑠
1−𝑟𝑟
En general, “un valor de la variable que haga que la ecuación sea una proposición cierta, se
denomina raíz o solución de la ecuación”. Para encontrar dichas raíces es menester resolver la
ecuación. En esta resolución se puede llevar a cabo a través de principios (Arya et al, 2009):
a. Principio de adición: se puede sumar o restar cualquier constante o expresión algebraica

que incluya la variable a ambos lados de la ecuación.
b. Principio de multiplicación: se puede multiplicar o dividir ambos lados de la ecuación por
cualquier constante distinta de cero o cualquier expresión distinta de cero que incluya la
variable.
Ejemplo:
5𝑥𝑥 − 3 = 2𝑥𝑥 + 9
3𝑥𝑥 = 12 Solución: x=4.
3.6.1. Ecuaciones lineales.
La forma estándar de una ecuación lineal corresponde a (Arya et al, 2009):
𝑎𝑎𝑎𝑎 + 𝑏𝑏 = 0 (3.5)
11
Con 𝑎𝑎 ≠ 0, y a, b constantes. La solución de la ecuación es 𝑥𝑥 = −𝑏𝑏/𝑎𝑎. Un ejemplo de ecuación
lineal puede ser:
2𝑥𝑥 + 3 = 0
Donde 𝑎𝑎 = 2 y 𝑏𝑏 = 3, por lo que la solución de la ecuación es 𝑥𝑥 = −3/2 . Más adelante se

analizaran formas más complejas de ecuaciones lineales.
3.6.2. Ecuaciones Cuadráticas.
La forma estándar de una ecuación cuadrática corresponde a (Arya et al, 2009):
𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐 = 0 (3.6)
Done a, b, y c son constantes. La solución de una ecuación cuadrática se puede realizar a través de
dos formas. Por ejemplo, se tiene la siguiente expresión, cuya factorización nos conduce a las raíces
de dicha ecuación.
3𝑥𝑥 2 + 5𝑥𝑥 − 2 = 0
3𝑥𝑥 2 + (6 − 1)𝑥𝑥 − 2 = 0
3𝑥𝑥 2 + 6𝑥𝑥 − 𝑥𝑥 − 2 = 0
3𝑥𝑥(𝑥𝑥 + 2) − (𝑥𝑥 + 2) = 0
(3𝑥𝑥 − 1)(𝑥𝑥 + 2) = 0
Por lo que las raíces de la ecuación son 𝑥𝑥 = 1/3, y 𝑥𝑥 = −2. Sin embargo, también podemos usar la
formula cuadrática. Si se tiene:
𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐 = 0 con 𝑎𝑎 ≠ 0
Entonces, las raíces se obtienen de la ecuación (3.7).
−𝑏𝑏±√𝑏𝑏2 −4𝑎𝑎𝑎𝑎
𝑥𝑥 = (3.7)
2𝑎𝑎
Por ejemplo, para la ecuación anterior, la solución se obtiene:
−5±�52 −4(3(−2))
𝑥𝑥 = 2(3)
−5±√25+24
𝑥𝑥 = 6
1
𝑥𝑥1 = ^ 𝑥𝑥2 = −2
3
3.6.3. Sistemas de Ecuaciones.
Las ecuaciones permiten resolver una serie de problemas matemáticos. Sin embargo, al analizar
algunos fenómenos podemos ver que existen una serie de problemas en los cuales existe más de un
ecuación. A continuación se revisan algunos ejemplos de sistemas de ecuaciones.
12
Ejemplo 1. Un sistema de ecuaciones puede ser el siguiente (Arya et al, 2009):
𝑥𝑥 + 𝑦𝑦 = 3
3𝑥𝑥 − 𝑦𝑦 = 1
La primera ecuación implica que x=3-y, por lo que reemplazando en la segunda:
3(3 − 𝑦𝑦) − 𝑦𝑦 = 1
9 − 3𝑦𝑦 − 𝑦𝑦 = 1
9 − 4𝑦𝑦 = 1
4𝑦𝑦 = 8
Lo que implica que y=2 y x=1.
Ejemplo 2. Usted puede tener el siguiente sistema de ecuaciones con dos variables, y y P.
y = α + βP
y = γ + θP
A continuación se muestra la resolución del sistema.
α + βP = γ + θP
βP − θP = γ − α
P( β − θ ) = γ − α
γ −α
P=
(β − θ )
Dado que se tiene el valor de P expresado en parámetros, se puede obtener el valor de y

reemplazando en cualquiera de las dos ecuaciones.
y = α + βP
(γ − α )
y =α + β
(β − θ )
α ( β − θ ) + β (γ − α )
y=
(β − θ )
αβ − αθ + βγ − βα
y=
(β − θ )
− αθ + βγ
y=
(β − θ )
βγ − αθ
y=
(β − θ )
De hecho, podemos comprobar si el par (y, P) corresponde a los valores correctos. Para esto
podemos reemplazar directamente en la primera ecuación del sistema:
y = α + βP
βγ − αθ (γ − α )
=α + β
(β − θ ) (β − θ )
13
βγ − αθ α ( β − θ ) + β (γ − α )
=
(β − θ ) (β − θ )
βγ − αθ αβ − αθ + βγ − βα
=
(β − θ ) (β − θ )
βγ − αθ − αθ + βγ
=
(β − θ ) (β − θ )
βγ − αθ βγ − αθ
=
(β − θ ) (β − θ )
Ejemplo 3. De lo anterior se puede ver que un sistema de ecuaciones se puede resolver de diferentes
formas, sin embargo, es importante dejar el sistema de una forma en la cual se puede resolver de
forma simple. Analice el siguiente ejercicio.
2 1 1
−1
= −1
− −1
x 200 y
1 x
= 20 + −1
y −1 2
En este caso, primero debemos expresar en forma más simple el sistema, esto es:
2 x = 200 − y
y = 20 + 2 x
Ahora se procede a resolver el sistema. Una forma simple de hacerlo es reemplazar la primera
ecuación (2x=200-y) directamente en la segunda, pues esta última tiene textualmente, como
segundo miembro del lado derecho, a 2x.
y = 20 + 2 x
y = 20 + (200 − y )
y + y = 220
2 y = 220
y = 110
Dado que y=110, entonces x es igual a 45.
3.7. Funciones.
Una función “es una regla matemática que asigna a cada valor de entrada uno y solo un valor de
salida” (Budnick, 2007: 143). En forma adicional, la función considera dominio y rango. El
dominio corresponde al conjunto de todos los valores de entrada, mientras que el rango, a todos los
valores de salida.
De la definición anterior se deriva que si dos valores del dominio, tienen cada uno, un valor
independiente en el rango, existe una función. Si dos valores del dominio tienen el mismo valor en
el rango, también estamos en presencia de una función. Pero si un valor del dominio, tienen dos
valores asociados en el rango, la relación expuesta no corresponde a una función.
14
Si se tiene una función, la expresamos mediante la forma y=f(x), donde y es función de x. En otras
palabras, y depende de los valores que tome la variable x. Esta definición es interesante desde el
punto de las ciencias sociales, toda vez que en esta es importante analizar la relación de
dependencia que existe entre dos variables, tales como los efectos de la pobreza sobre el grado de
desnutrición en las personas.
En este punto, es importante destacar que las funciones pueden tomar distintas formas. De las
ecuaciones, sabemos que pueden existir ecuaciones lineales y cuadráticas, entre otras. Con las
funciones sucede lo mismo, pues la relación entre la variable x e y puede ser lineal, o no lineal.
3.7.1. Funciones Lineales.
Ejemplo 1: Si tomamos el ejemplo 3 de la sección anterior, segunda ecuación, sabemos que esta
corresponde a y = 20 + 2x. Si suponemos que dicha ecuación es una expresión concreta de y=f(x),
estamos reconociendo que la variable y depende de x, o que en otras palabras, la variable
dependiente es y, mientras que la independiente es x.
Es más, de la forma estándar de la ecuación lineal, sabemos que esta expresión efectivamente
corresponde a una ecuación lineal, donde b=20 y a=2. En el lenguaje de las funciones b corresponde
al intercepto, o el valor que toma y cuando x=0, y a es la pendiente.
En este caso se sabe que la relación entre las variables es lineal, pues su forma corresponde a una
función lineal, y por otro lado que la relación entre las variables es positiva, pues a medida que
aumenta x aumenta y. El grafico de dicha función se observa en la figura 3.1, en la cual el eje de las
abscisas corresponde al eje x, mientras que el eje de las ordenadas ordenadas corresponde al eje y.
Figura 3.1: Función lineal.
20
0 x
Ejemplo 2: Suponga que un investigador ha encontrado que a mayor escolaridad de las personas
existe un mayor interés de ellas por la política. Dicho investigador a determinado empíricamente
que la relación entre el grado de rendición de cuentas (RC) de los organismos públicos y la
escolaridad de los ciudadanos (Esc) responde a la siguiente función, donde RC corresponde a un
índice que el investigador a elaborado.
𝑅𝑅𝑅𝑅 = 1 + 0.3𝐸𝐸𝐸𝐸𝐸𝐸 (3.8)
Lo que nos dice la ecuación 3.8 es que la relación entre las variables es de carácter lineal, y la
escolaridad impacta positivamente en el grado de rendición de cuentas de los individuos. Es más,
por cada aumento de una unidad en la escolaridad, el grado índice de rendición de cuentas aumenta
en 0.3.
15
Suponga que de pronto se publica la Ley de Transparencia, lo que significa que los organismos
públicos, sin importar las demandas de la ciudadanía, deben aumentar su nivel de rendición de
cuentas, y que se estima que el aumento autónomo en la rendición de cuentas es de un 27%. Si esto
ocurre, debemos preguntarnos respecto de cuál es el componente autónomo de la RC, que no tiene
que ver con las características de la ciudadanía. Dicho componente es el intercepto, el que aumenta
en 27%, y que deja a la ecuación como:
𝑅𝑅𝑅𝑅 = 1.27 + 0.3𝐸𝐸𝐸𝐸𝐸𝐸 (3.9)
Gráficamente, lo que se produce es que aumenta el intercepto, desplazándose la función de forma

paralela.
Figura 3.2: Función lineal de RC.
RC
1.27
1
0 Esc
Ejemplo 3: Al igual que el caso de las ecuaciones, también pueden existir sistemas de ecuaciones.
Este es caso de la economía, en particular, de las funciones de oferta y demanda. De acuerdo a las
leyes de la oferta y la demanda, se tiene que la “ley de la demanda” es la observación empírica
según la cual, cuando baja el precio de un producto, los consumidores demandan una mayor
cantidad. Por otro lado, la “ley de la oferta” es la observación empírica según la cual, cuando sube
el precio de un producto, las empresas ofrecen una cantidad mayor (Frank, 2005). Con esto, y
suponiendo que 𝛽𝛽 < 0 y 𝜃𝜃 > 0, podríamos pensar que las ecuaciones siguientes corresponde a
expresiones de demanda y oferta, respectivamente.
𝑦𝑦 = 𝛼𝛼 + 𝛽𝛽𝛽𝛽
𝑦𝑦 = 𝛾𝛾 + 𝜃𝜃𝜃𝜃
Si en forma adicional, consideramos las siguientes pares (P,y) para el consumidor: (2.5,1), (2,2),
(1.5,3) y (1,4); y los siguientes pares (P,y) para el productor: (1,0), (2,2) y (2.5,3), podemos obtener
el valor de los parámetros de las ecuaciones de demanda y oferta. Al graficar los pares de
consumidor y productor se puede ver que efectivamente corresponden a funciones lineales.
Entonces para obtener la pendiente de la curva de demanda podemos tomar dos puntos
cualesquiera, por ejemplo, los dos primeros.
𝑦𝑦2 −𝑦𝑦1 2−1 1
𝛽𝛽 = 𝑃𝑃2 −𝑃𝑃1
= = = −2
2−2.5 −0.5
A continuación, se reemplaza la pendiente y un punto cualquiera en la función de demanda, con el

objeto de obtener el intercepto. En este caso reemplazaremos el segundo punto (2,2):
𝑦𝑦 = 𝛼𝛼 + 𝛽𝛽𝛽𝛽
2 = 𝛼𝛼 + (−2)2
𝛼𝛼 = 6
16
Entonces, la ecuación de la demanda queda definida por
𝑦𝑦 𝑑𝑑 = 6 − 2𝑃𝑃
Procediendo de la misma forma para la ecuación de oferta, esta queda determinada por la ecuación.
𝑦𝑦 𝑜𝑜 = −2 + 2𝑃𝑃
Ejemplo 4: Una vez conocidas las funciones lineales de oferta y demanda, se pueden usar dichas
funciones para obtener el equilibrio de mercado. Suponga las siguientes funciones:
5
𝑄𝑄 𝑜𝑜 = 10 + 𝑃𝑃
2
5
𝑄𝑄 𝑑𝑑 = 50 − 𝑃𝑃
2
Para obtener el equilibrio se deben igualar ambas ecuaciones. En un equilibrio se asume que existe
un único precio que equilibra el mercado (pe), y que a este precio, lo que los vendedores venden es
igual a lo que los compradores quieren comprar. Se puede tomar este último supuesto (𝑄𝑄 𝑜𝑜 = 𝑄𝑄 𝑑𝑑 ) e
igualar las ecuaciones.
𝑄𝑄𝑜𝑜 = 𝑄𝑄 𝑑𝑑
5 5
10 + 𝑃𝑃 = 50 − 𝑃𝑃
2 2
10
𝑃𝑃= 40
2
𝑃𝑃 = 8
Por lo que reemplazando el precio en cualquiera de las dos ecuaciones, se tiene que 𝑄𝑄 = 30. Por
último, el equilibrio de mercado se puede graficar en la figura 3.3.
Figura 3.3: Oferta y Demanda.
0 30 Q
Ejemplo 5: otro ejemplo de sistema de ecuaciones se tiene en el modelo ISLM de macroeconomía.

En dicho modelo, la curva IS (Inversión-Ahorro) representa el equilibrio en el mercado de bienes,
mientras que la LM (Demanda de Dinero-Oferta de Dinero) representa el equilibrio en el mercado
del dinero. Sean la curva IS y LM las siguientes (Dornbusch et al, 2004: 243), respectivamente:
𝑌𝑌 = 𝛼𝛼𝐺𝐺 (𝐴𝐴̅ − 𝑏𝑏𝑏𝑏) (IS)

1 �
𝑀𝑀
𝑖𝑖 = ℎ
�𝑘𝑘𝑘𝑘 −
𝑃𝑃�
� (LM)
17
Donde Y es el ingreso, 𝛼𝛼𝐺𝐺 el multiplicador de la política fiscal, 𝐴𝐴̅ es el gasto autónomo, 𝑏𝑏 es la
sensibilidad de la inversión a la tasa de interés, e 𝑖𝑖 es la tasa de interés. En la curva LM, ℎ es la
sensibilidad de la demanda de saldos reales a la tasa de interés, mientras que k es la sensibilidad de
� ⁄𝑃𝑃� es la oferta de dinero real. Al solucionar este sistema, se tiene que el nivel de
esta al ingreso, y 𝑀𝑀
ingreso es igual a:
ℎ𝛼𝛼𝐺𝐺 𝑏𝑏𝛼𝛼 �
𝑀𝑀
𝑌𝑌 =
ℎ+𝑘𝑘𝑘𝑘𝛼𝛼𝐺𝐺
𝐴𝐴̅ 𝐺𝐺
+ ℎ+𝑘𝑘𝑘𝑘𝛼𝛼 �
(3.10)
𝐺𝐺 𝑃𝑃
3.7.2. Funciones Cuadráticas.
Como se estableció más arriba, las funciones también pueden tomar formas no lineales. En
particular, una función cuadrática está definida por la forma (Arya et al, 2009: 187):
𝑓𝑓(𝑥𝑥) = 𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐 con 𝑎𝑎 ≠ 0 (3.11)
Donde a, b y c son constantes. Es posible calcular la posición de dicha función, lo que se lleva a
cabo a través del siguiente teorema.
Teorema: el vértice de la función cuadrática se puede obtener mediante las siguientes fórmulas
(Arya et al, 2009: 188):
𝑏𝑏 4𝑎𝑎𝑎𝑎−𝑏𝑏2
𝑥𝑥 = − ^ 𝑦𝑦 = (3.12)
2𝑎𝑎 4𝑎𝑎
Ejemplo 1: A continuación se presentan ejemplos de diferentes funciones cuadráticas. Como se

observa, todas tienen la estructura de 3.11 pero bajo diferentes parámetros para a, b y c.
𝑦𝑦 = 𝑥𝑥 2 (3.13)
𝑦𝑦 = 𝑥𝑥 2 + 10 (3.14)
𝑦𝑦 = 𝑥𝑥 2 − 𝑥𝑥 + 10 (3.15)
𝑦𝑦 = 𝑥𝑥 2 − 2𝑥𝑥 + 10 (3.16)
Usando las fórmulas de 3.12 se puede obtener el vértice para cada una de las funciones, las que
corresponden respectivamente a:
𝑥𝑥 =0 ^ 𝑦𝑦 = 0 (3.13’)
𝑥𝑥 =0 ^ 𝑦𝑦 = 10 (3.14’)
1
𝑥𝑥 = ^ 𝑦𝑦 = 9.75 (3.15’)
2
𝑥𝑥 =1 ^ 𝑦𝑦 = 9 (3.16’)
Tal como se observa en la figura 3.4, el vértice de 3.13 es (0,0), el de 3.14 es (0, 10), para 3.15 es
(½, 9.75), mientras que para 3.16 es (1, 9). En otras palabras, dependiendo de los diferentes
parámetros de la función cuadrática, esta presentará diferentes posiciones.
18
Figura 3.4: Diferentes Funciones Cuadráticas, Ejemplo 1.
Fuente: Elaboración propia usando el Software MAXIMA.
Ejemplo 2: Dado que es posible obtener diferentes funciones cuadráticas alterando los parámetros
de la fórmula 3.11, también es posible obtener funciones con formas inversas en el plano x,y. Para
esto es posible alterar el parámetro a de la ecuación 3.17, que pasa de 𝑎𝑎 = 1 en 3.17 a 𝑎𝑎 = −1 en la
ecuación 3.18, y cuya gráfica se observa en la Figura 3.5.
𝑦𝑦 = 𝑥𝑥 2 + 10 (3.17)
𝑦𝑦 = −𝑥𝑥 2 + 5 (3.18)
Figura 3.5: Diferentes Funciones Cuadráticas, Ejemplo 2.
Ejemplo 3: En la realidad se pueden encontrar una serie de relaciones de carácter no lineal. Un caso
interesante es la curva de Kuznets, la que establece que la desigualdad del ingreso aumenta a
medida que el Producto Interno Bruto crece (PIB), sin embargo, dado un punto, la desigualdad
comienza a bajar. Este caso se observa en la figura 3.6. No obstante la importancia de su valor
teórico, esta relación ha sido ampliamente cuestionada desde el punto vista empírico (Ver Palma
(2011)).
19
Figura 3.6: Curva de Kuznets.
Desigualdad
PIB
Ejemplo 4: Otro ejemplo importante, que no representa una función cuadrática, pero si no lineal,
corresponde a la curva de demanda agregada. Dicha curva se puede derivar a partir del modelo
ISLM. Al tomar ecuación del producto, en el ejemplo 5 de la sección anterior, y reemplazar los
multiplicadores por expresiones más sencillas queda:
ℎ𝛼𝛼𝐺𝐺 𝑏𝑏𝛼𝛼𝐺𝐺 𝑀𝑀 �
𝑌𝑌 = 𝐴𝐴̅ +
ℎ+𝑘𝑘𝑘𝑘𝛼𝛼𝐺𝐺 ℎ+𝑘𝑘𝑘𝑘𝛼𝛼𝐺𝐺 𝑃𝑃�
�
𝑀𝑀 ℎ𝛼𝛼 𝑏𝑏
𝑌𝑌 = 𝛾𝛾𝐴𝐴̅ + 𝛽𝛽 𝐺𝐺
con 𝛾𝛾 = ℎ+𝑘𝑘𝑘𝑘𝛼𝛼 y 𝛽𝛽 = 𝛾𝛾 ℎ.
𝑃𝑃 𝐺𝐺
De la última ecuación, y si dejamos libre el nivel de precios, se tiene que la curva de demanda
agregada depende negativamente del nivel de precios, pero de una forma no lineal, tal como se
puede apreciar a continuación.
𝑌𝑌 = 𝛾𝛾𝐴𝐴̅ + 𝛽𝛽𝑀𝑀
� 𝑃𝑃−1 (3.19)
3.8. Derivadas.
La derivada es un concepto muy utilizado en las ciencias exactas y sociales. Existen muchas
aplicaciones en el área de la economía, la administración, la sociología, y la ciencia política, por
solo mencionar algunas disciplinas, que utilizan dicho concepto (sin saberlo incluso). En palabras
simples, la derivada corresponde a la pendiente de la tangente a un punto de la función.
Formalmente, dada la función 𝑦𝑦 = 𝑓𝑓(𝑥𝑥), la derivada de la función es (Budnick, 2007: 732) la

siguiente:
𝑑𝑑𝑑𝑑 𝑓𝑓(𝑥𝑥+∆𝑥𝑥)−𝑓𝑓(𝑥𝑥)
= 𝑙𝑙𝑙𝑙𝑙𝑙∆𝑥𝑥→0 (3.20)
𝑑𝑑𝑑𝑑 ∆𝑥𝑥
Asumiendo que existe el límite.
En este sentido, se puede encontrar la derivada de la siguiente función (Ayres, 1971: 22):
𝑦𝑦 = 𝑓𝑓(𝑥𝑥) = 𝑥𝑥 2 + 3𝑥𝑥
Aplicando la definición, se tiene:
𝑑𝑑𝑑𝑑 (𝑥𝑥+∆𝑥𝑥)2 +3(𝑥𝑥+∆𝑥𝑥)−(𝑥𝑥 2 +3𝑥𝑥)

= 𝑙𝑙𝑙𝑙𝑙𝑙∆𝑥𝑥→0
20
𝑑𝑑𝑑𝑑 𝑥𝑥 2 +2𝑥𝑥∆𝑥𝑥+(∆𝑥𝑥)2 +3𝑥𝑥+3∆𝑥𝑥−𝑥𝑥 2 −3𝑥𝑥
𝑑𝑑𝑑𝑑 2𝑥𝑥∆𝑥𝑥+(∆𝑥𝑥)2+3∆𝑥𝑥
𝑑𝑑𝑑𝑑 ∆𝑥𝑥(2𝑥𝑥+∆𝑥𝑥+3)
𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑
= 𝑙𝑙𝑙𝑙𝑙𝑙∆𝑥𝑥→0 (2𝑥𝑥 + ∆𝑥𝑥 + 3)
𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑
= 2𝑥𝑥 + 3
Asimismo, es posible obtener la derivada de la siguiente función (Budnick, 2007: 733):
𝑦𝑦 = 𝑓𝑓(𝑥𝑥) = −5𝑥𝑥 + 9
𝑑𝑑𝑑𝑑 −5(𝑥𝑥+∆𝑥𝑥)+9−(−5𝑥𝑥+9)
𝑑𝑑𝑑𝑑 −5𝑥𝑥−5∆𝑥𝑥+9+5𝑥𝑥−9
𝑑𝑑𝑑𝑑 −5∆𝑥𝑥
𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑
= 𝑙𝑙𝑙𝑙𝑙𝑙∆𝑥𝑥→0 (−5)
𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑
= −5
Sin embargo, en la práctica es complejo aplicar la definición de derivada a cada una de las
funciones, razón por la que existen reglas de derivación. En la siguiente tabla aparecen las reglas
más usadas en la derivación (Budnick, 2007). Cabe destacar que 𝑓𝑓(𝑥𝑥) corresponde a la función,
𝑑𝑑𝑑𝑑
mientras que 𝑓𝑓′(𝑥𝑥) = .
𝑑𝑑𝑑𝑑
21
Tabla 3.1: Reglas de derivación.
f (x) f ' ( x)
f ( x) = x n
f ' ( x) = nx n−1
f ( x) = c f ' ( x) = 0
h( x ) = f ( x ) + g ( x ) h' ( x ) = f ' ( x ) + g ' ( x )
h( x ) = f ( x ) − g ( x ) h' ( x ) = f ' ( x ) − g ' ( x )
h( x ) = k * g ( x ) h' ( x ) = k * g ' ( x )
f ( x ) = g ( x ) * h( x ) f ( x ) = g ' ( x ) h( x ) + g ( x ) h' ( x )
f ( x ) = g ( x ) / h( x ) g ' ( x ) h( x ) − g ( x ) h' ( x )
f ( x) =
[h( x)]2
f ( x) = [ g ( x)]n f ' ( x) = n[ g ( x)]n−1 * g ' ( x)
f ( x) = g[h( x)] f ' ( x) = g ' [h( x)] * h' ( x)
f ( x) = e g ( x ) f ' ( x) = e g ( x ) * g ' ( x)
f ( x) = ln g ( x) 1
f ' ( x) = g ' ( x)
g ( x)
f ( x) = x f ' ( x) =
1
2 x
Fuente: elaboración propia en base a Budnick (2007).
22
La mejor forma de aprender y comprender las reglas de derivación es a través de la aplicación, por
lo que a continuación se plantean algunos ejercicios.
Ejemplos:
a) 𝑦𝑦(𝑥𝑥) = 11
𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑
=0
b) 𝑦𝑦(𝑥𝑥) = −12𝑥𝑥
𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑
= −12
c) 𝑦𝑦(𝑥𝑥) = 𝑥𝑥 2 + 3𝑥𝑥
𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑
= 2𝑥𝑥 + 3
d) 𝐼𝐼𝐼𝐼(𝑞𝑞) = 𝑝𝑝(𝑞𝑞)𝑞𝑞
𝑑𝑑𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑(𝑞𝑞) 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑(𝑞𝑞)
𝑑𝑑𝑑𝑑
= 𝑑𝑑𝑑𝑑
𝑞𝑞 + 𝑝𝑝(𝑞𝑞) 𝑑𝑑𝑑𝑑 = 𝑑𝑑𝑑𝑑
𝑞𝑞 + 𝑝𝑝(𝑞𝑞)
e) 𝑦𝑦 = (𝑥𝑥 2 + 6)3
𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑
= 3(𝑥𝑥 2 + 6)2 (2𝑥𝑥) = 6𝑥𝑥(𝑥𝑥 4 + 12𝑥𝑥 2 + 36)
f) 𝑦𝑦 = 20√𝑥𝑥
𝑑𝑑𝑑𝑑 20 10
= =
𝑑𝑑𝑑𝑑 2√𝑥𝑥 √𝑥𝑥
g) 𝑦𝑦 = ln(5𝑥𝑥 5 )
𝑑𝑑𝑑𝑑 1 5
𝑑𝑑𝑑𝑑
= 5𝑥𝑥5 25𝑥𝑥4 = 𝑥𝑥
x 5
h) 𝑦𝑦 = �1+x �
𝑑𝑑𝑑𝑑 x 4 x′ (1+x)−x(1+x)′ x 4 (1+x)−x 5𝑥𝑥 4

= 5 �1+x� � (1+x)2
� = 5 �1+x� � ( � = (1+𝑥𝑥)6
𝑑𝑑𝑑𝑑 1+x)2
i) 𝑦𝑦(𝑃𝑃) = 𝛼𝛼 + 𝛽𝛽𝛽𝛽
𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑
= 𝛽𝛽 y sabemos que 𝛽𝛽 < 0.
j) 𝑅𝑅𝑅𝑅(𝐸𝐸𝐸𝐸𝐸𝐸) = 1.27 + 0.3𝐸𝐸𝐸𝐸𝐸𝐸
𝑑𝑑𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
= 0.33
23
Ejercicios Propuestos: a continuación se proponen una serie de ejercicios con el objeto de ejercitar
las derivadas (Ayres, 1971):
𝑑𝑑𝑑𝑑
a) 𝑦𝑦 = 𝑥𝑥 5 + 5𝑥𝑥 4 − 10𝑥𝑥 2 + 6 sol. 𝑑𝑑𝑑𝑑
= 5𝑥𝑥(𝑥𝑥 3 + 4𝑥𝑥 2 − 4)
1 4 𝑑𝑑𝑑𝑑 1 2
b) 𝑦𝑦 = + sol. =− −
2𝑥𝑥 2 √𝑥𝑥 𝑑𝑑𝑑𝑑 𝑥𝑥 3 𝑥𝑥 3/2
𝑑𝑑𝑑𝑑 1+√2
c) 𝑦𝑦 = √2𝑥𝑥 + 2√𝑥𝑥 sol. =
𝑑𝑑𝑑𝑑 √2𝑥𝑥
𝑑𝑑𝑑𝑑
d) 𝑦𝑦 = (1 − 5𝑥𝑥)6 sol. 𝑑𝑑𝑑𝑑
= −30(1 − 5𝑥𝑥)5
1
𝑑𝑑𝑑𝑑 2−𝑥𝑥
e) 𝑦𝑦 = (3 + 4𝑥𝑥 − 𝑥𝑥 2 )2 sol. =
𝑑𝑑𝑑𝑑 𝑦𝑦
3𝑟𝑟+2 𝑑𝑑𝑑𝑑 5
f) 𝜃𝜃 = sol. = (2𝑟𝑟+3)2
2𝑟𝑟+3 𝑑𝑑𝑑𝑑
𝑥𝑥 5 𝑑𝑑𝑑𝑑 5𝑥𝑥 4
g) 𝑦𝑦 = � � sol. = (1+𝑥𝑥)6
1+𝑥𝑥 𝑑𝑑𝑑𝑑
𝑤𝑤 𝑑𝑑𝑑𝑑 1
h) 𝑦𝑦 = sol. = (1−4𝑤𝑤2 )3/2
√1−4𝑤𝑤 2 𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑 1
i) 𝑦𝑦 = �1 + √𝑥𝑥 sol. =
𝑑𝑑𝑑𝑑 4�𝑥𝑥+𝑥𝑥√𝑥𝑥
𝑥𝑥−1 𝑑𝑑𝑑𝑑 1
j) 𝑓𝑓(𝑥𝑥) = � sol. =
𝑥𝑥+1 𝑑𝑑𝑑𝑑 (𝑥𝑥+1)√𝑥𝑥 2 −1
3.8.1. Aplicaciones de la derivada.
La derivada tiene un uso de utilidad pues permite obtener cual es el punto que maximiza o minimiza
una función. Esto eso, suponga que la curva de producción de un organismo público se puede
definir como una función f(x)=y, tal como la que aparece en la Figura 3.7, donde x corresponde a un
insumo específico en la producción de cierto organismo público (i.e. insumos de oficina en una
repartición pública). Ya que la derivada corresponde a la pendiente en un punto (y’), puedo
restringir la pendiente en cero (y’=0), y así obtener el mínimo o máximo de la respectiva función.
En este caso y’=0 en el punto A, y el x correspondiente al punto A es el x que maximiza la función.
24
Figura 3.7: Curva de Producción de un Organismo Público
y A
y’=0
Ejemplo 1: Si la función y de la Figura 3.7 corresponde a 𝑦𝑦 = 2 + 𝑥𝑥 − 𝑥𝑥 2 , entonces al aplicar la

condición de primer orden (𝑦𝑦 ′ = 0) llegamos a 𝑦𝑦 ′ = 0 => 1 − 2𝑥𝑥 = 0. Al obtener la segunda
derivada de la expresión 𝑦𝑦 = 2 + 𝑥𝑥 − 𝑥𝑥 2 , esto es, 𝑦𝑦 ′′ = −2 < 0, sabemos que corresponde a un
máximo. Entonces, el valor de x que maximiza la función corresponde a ½.
Este último punto es importante, pues la condición de primer orden (CPO) indica que la derivada
debe ser cero, lo que nos puede situar en un mínimo o un máximo, dependiendo de la forma de la
función. La segunda derivada es la que nos indica si hemos encontrado un mínimo (𝑦𝑦 ′′ > 0) o un
máximo (𝑦𝑦 ′′ < 0).
Adicionalmente, la derivada tiene múltiples usos de gran interés para las ciencias sociales. En
nuestro curso será de vital importancia para las sesiones de econometría.
Método de los Multiplicadores de Lagrange: Un ejemplo importante de aplicación de las derivadas

se tiene en el caso de la “Teoría del Consumidor” en Microeconomía. Si bien este caso se aplica al
consumidor, se puede pensar en un sinfín situaciones en las cuales un individuo, un individuo
representativo, o una organización, deben maximizar algún tipo de función sujeto a una restricción.
Para ilustrar este punto piense en la maximización del bien común (medido de alguna forma) sujeto
a la restricción de los recursos del Estado, en la maximización de las consultas de calidad de un
hospital sujeto a la restricción presupuestaria de dicho hospital, en la maximización de la calidad de
la educación medida por el SIMCE (proxy de la calidad de la educación) sujeta a los recursos
disponibles del colegio respectivo.
Respecto del problema básico del consumidor, se puede pensar en que este tiene una utilidad
𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕
definida por la función 𝑈𝑈 = 𝑈𝑈(𝑥𝑥, 𝑦𝑦), donde > 0 y > 0, esto es, x e y son bienes. En forma
𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕
adicional se puede pensar en la restricción que enfrenta el consumidor. En este caso los bienes x e y
están disponibles en la economía, pero a un precio 𝑝𝑝𝑥𝑥 y 𝑝𝑝𝑦𝑦 , y el consumidor tiene un ingreso I, para
gastar en los dos bienes. De acuerdo a esto, el problema del consumidor queda definido por:
𝑚𝑚𝑚𝑚𝑚𝑚𝑥𝑥,𝑦𝑦 𝑈𝑈 = 𝑈𝑈(𝑥𝑥, 𝑦𝑦) (Función de Utilidad)

Sujeto a:
𝐼𝐼 = 𝑝𝑝𝑥𝑥 𝑥𝑥 + 𝑝𝑝𝑦𝑦 𝑦𝑦 (Restricción Presupuestaria)
Donde se deja claro que el individuo quiere maximizar una función de utilidad U¸ eligiendo para
ello las variables x e y, sujeto a la restricción 𝐼𝐼 = 𝑝𝑝𝑥𝑥 𝑥𝑥 + 𝑝𝑝𝑦𝑦 𝑦𝑦. Una forma útil de solucionar este
problema es recurrir al método de los Multiplicadores de Lagrange, el que consiste en plantear el
problema de la siguiente forma:
25
𝐿𝐿 = 𝑈𝑈(𝑥𝑥, 𝑦𝑦) + 𝜆𝜆[𝐼𝐼 − 𝑝𝑝𝑥𝑥 𝑥𝑥 − 𝑝𝑝𝑦𝑦 𝑦𝑦] (3.21)
Donde L es el Lagrange y 𝜆𝜆 es el multiplicador de Lagrange. En este problema se ha incorporado

simultáneamente la función de utilidad y la restricción presupuestaria, y el óptimo se puede obtener
encontrando las siguientes CPO del problema.
𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕
𝜕𝜕𝜕𝜕
= 0, 𝜕𝜕𝜕𝜕
= 0, 𝜕𝜕𝜕𝜕
=0 (3.22)
Entonces, al resolver las tres condiciones, se tienen 3 ecuaciones. Al tener 3 variables y 3

ecuaciones, se puede resolver el problema para x, y y 𝜆𝜆.
Ejemplo 1: Sea 𝑈𝑈 = 𝑥𝑥𝑥𝑥, sujeto a 𝐼𝐼 = 𝑝𝑝𝑥𝑥 𝑥𝑥 + 𝑝𝑝𝑦𝑦 𝑦𝑦. En este caso se plantea el problema y se resuelven
las CPO.
𝐿𝐿 = 𝑥𝑥𝑥𝑥 + 𝜆𝜆[𝐼𝐼 − 𝑝𝑝𝑥𝑥 𝑥𝑥 − 𝑝𝑝𝑦𝑦 𝑦𝑦]
𝜕𝜕𝜕𝜕
𝜕𝜕𝜕𝜕
= 𝑦𝑦 − 𝜆𝜆𝑝𝑝𝑥𝑥 = 0 (3.23)
𝜕𝜕𝜕𝜕
𝜕𝜕𝜕𝜕
= 𝑥𝑥 − 𝜆𝜆𝑝𝑝𝑦𝑦 = 0 (3.24)
𝜕𝜕𝜕𝜕
𝜕𝜕𝜕𝜕
= 𝐼𝐼 − 𝑝𝑝𝑥𝑥 𝑥𝑥 − 𝑝𝑝𝑦𝑦 𝑦𝑦 = 0 (3.25)
Despejando 𝜆𝜆 en (3.23) y en (3.24) se tiene:

𝑦𝑦 𝑥𝑥
𝜆𝜆 = ^ 𝜆𝜆 =
𝑝𝑝𝑥𝑥 𝑝𝑝𝑦𝑦
Igualando las expresiones anteriores se tiene la siguiente ecuación, que indica que la Utilidad
Marginal de x por peso gastado en x, es igual a la Utilidad Marginal de y por peso gastado y.
𝑦𝑦 𝑥𝑥
= (3.26)
𝑝𝑝𝑥𝑥 𝑝𝑝𝑦𝑦
Finalmente, reemplazando (3.26) en (3.25), se tiene:
𝐼𝐼 = 𝑝𝑝𝑥𝑥 𝑥𝑥 + 𝑝𝑝𝑦𝑦 𝑦𝑦
𝑝𝑝 𝑥𝑥
𝐼𝐼 = 𝑝𝑝𝑥𝑥 𝑥𝑥 + 𝑝𝑝𝑦𝑦 𝑥𝑥
𝑝𝑝𝑦𝑦
𝐼𝐼 = 2𝑝𝑝𝑥𝑥 𝑥𝑥
𝐼𝐼 𝐼𝐼
𝑥𝑥 ∗ = ^ 𝑦𝑦 ∗ = (3.27)
2𝑝𝑝𝑥𝑥 2𝑝𝑝𝑦𝑦
Donde 𝑥𝑥 ∗ e 𝑦𝑦 ∗ corresponden a los valores que maximizan la función, y son lo que en la Teoría
Microeconómica se conoce como Demandas Marshallianas. Dichos valores se pueden reemplazar
en la función de Utilidad obteniendo así la Función de Utilidad Indirecta (FUI):
𝑈𝑈 = 𝑥𝑥 ∗ 𝑦𝑦 ∗
26
𝐼𝐼 𝐼𝐼
𝑈𝑈 =
2𝑝𝑝𝑥𝑥 2𝑝𝑝𝑦𝑦
𝐼𝐼2
𝑈𝑈 = 4𝑝𝑝 (FUI)
𝑥𝑥 𝑝𝑝𝑦𝑦
Ejemplo 2: El siguiente problema se inserta dentro de la “Teoría de los Costos” en Microeconomía.

Intuitivamente el problema dice relación con minimizar los costos de la empresa, sujeto a la función
de producción. Suponga una empresa que tiene la siguiente función de producción 𝑄𝑄 = 𝑓𝑓(𝐾𝐾, 𝐿𝐿) =
√𝐾𝐾𝐾𝐾, donde 𝑟𝑟 = 4 es el precio del capital y 𝑤𝑤 = 2 corresponde al salario (Frank, 2005: 339). Para
obtener los valores de K y L que minimizan el costo de la empresa al producir 2 unidades, se plantea
el problema de optimización:
𝜓𝜓 = 𝑟𝑟𝑟𝑟 + 𝑤𝑤𝑤𝑤 + 𝜆𝜆[√𝐾𝐾𝐾𝐾 − 𝑄𝑄𝑜𝑜 ]
Las condiciones de primer orden corresponden a:
𝜕𝜕𝜓𝜓 √𝐿𝐿
= 𝑟𝑟 + 𝜆𝜆 2 =0 (3.28)
𝜕𝜕𝜕𝜕 √𝐾𝐾
𝜕𝜕𝜓𝜓 √𝐾𝐾
= 𝑤𝑤 + 𝜆𝜆 2 =0 (3.29)
𝜕𝜕𝜕𝜕 √𝐿𝐿
𝜕𝜕𝜓𝜓
𝜕𝜕𝜕𝜕
= √𝐾𝐾𝐾𝐾 − 𝑄𝑄𝑜𝑜 = 0 (3.30)
Despejando 𝜆𝜆 en (3.28) y en (3.29) se tiene:
2√𝐾𝐾 2√𝐿𝐿
𝜆𝜆 = −𝑟𝑟 ^ 𝜆𝜆 = −𝑤𝑤
√𝐿𝐿 √𝐾𝐾
Igualando las expresiones anteriores se tiene la siguiente ecuación, que indica que la Productividad
Marginal de L por peso gastado en L, es igual a la Productividad Marginal de K por peso gastado en
K.
√𝐾𝐾 √𝐿𝐿
� � � �
2√𝐿𝐿 2√𝐾𝐾
𝑤𝑤
= 𝑟𝑟
(3.31)
Y reemplazando los valores 𝑟𝑟 = 4 y 𝑤𝑤 = 2 en 3.31 se obtiene:

1
𝐾𝐾 = 𝐿𝐿 (3.32)
2
Finalmente, reemplazando 3.32 en 3.30, y reemplazando 𝑄𝑄𝑜𝑜 = 2, se tiene:
√𝐾𝐾𝐾𝐾 − 𝑄𝑄𝑜𝑜 = 0
1
� 𝐿𝐿2 − 2 = 0
2
1
𝐿𝐿� − 2 = 0
2
𝐿𝐿2
2
=4
27
𝐿𝐿 = √8
𝐿𝐿∗ = 2√2 , 𝐾𝐾 ∗ = √2
Por lo que la elección de K y L que minimiza el costo de producir 2 unidades corresponde a

𝐿𝐿∗ = 2√2 y 𝐾𝐾 ∗ = √2.
Ejercicios propuestos.
a) 𝑈𝑈 = √𝑥𝑥1 𝑥𝑥2 s.a. 1000 = 10𝑥𝑥1 + 5𝑥𝑥2

b) 𝑞𝑞 = 𝐾𝐾 0.35 𝐿𝐿0.65 s.a. 2.5𝐾𝐾 + 3.6𝐿𝐿 = 150
c) 𝐹𝐹 = 𝐾𝐾 0.5 𝐿𝐿0.5 s.a. 𝐾𝐾 2 + 𝐿𝐿2 = 1500
d) 𝐹𝐹 = 𝐾𝐾 0.6 𝐿𝐿0.2 s.a. 𝐾𝐾 2 + 𝐿𝐿2 = 2700
Referencias.
Arya, Jagdish C., y Lardner, Robin W. (2009). “Matemáticas aplicadas a la administración y a la

economía”. Quinta edición, Pearson Educación, México, 2009. ISBN: 978-607-442-302-0.
Ayres, Frank (1971). “Teoría y Problemas de Calculo Diferencial e Integral”. McGraw-Hill,

México, S.A. de C.V.
Budnick, Frank S. (2007). “Matemáticas aplicadas para administración, economía y ciencias

sociales”. Cuarta edición. McGraw-Hill/Interamericana Editores, S.A. de C.V.
Dornbusch, Fischer y Startz (2004). Macroeconomía. McGraw-Hill. 10a edición (D).
Frank, Robert (2005). “Microeconomía y Conducta”. 5ta Edición. Mc Graw Hill. España
Palma, José Gabriel (2011). “Homogeneous middles vs. heterogeneous tails, and the end of the
‘Inverted-U’: the share of the rich is what it’s all about”. Cambridge Working Papers in Economics
(CWPE) 1111. Available at http://www.econ.cam.ac.uk/dae/repec/cam/pdf/cwpe1111.pdf.
28
4. Estadística Descriptiva
4.1. Introducción
Es importante mencionar algunos conceptos de utilidad en estadística. Uno de los más usados dice
relación con el concepto de población, que consiste en “la recolección completa de todas las
observaciones de interés para el investigador” (Webster, 2000). Este concepto es de vital
importancia, toda vez que se refiere al conjunto total de datos, al que rara vez se puede acceder. Es
por eso que se recurre a la muestra, cuya definición dice que es “una parte representativa de la
población que se selecciona para ser estudiada ya que la población es demasiado grande como para
analizarla en su totalidad” (Webster, 2000).
Con estos conceptos, es posible definir lo que es un parámetro, que corresponde a una “medida
descriptiva de la población de observaciones de interés para el investigador”, mientras que un
estadístico es un “elemento que describe una muestra y sirve como una estimación del parámetro de
la población correspondiente” (Webster, 2000). Dada la diferencia entre población y muestra resulta
importante mencionar la diferencia entre parámetro y estadístico.
Por último, nuestro interés siempre estará en determinada característica de la muestra/población, y

esa característica se definirá en la mayoría de los casos como “variable”. Esta “es una característica
de la población que se está analizando en un estudio estadístico” (Webster, 2000). En la sección
siguiente se clasifican los tipos de variables que se enfrentan en el análisis estadístico.
4.1.1. Tipos de Variables
Dado que el objetivo del curso es aprender a cuantificar los fenómenos, se hace necesario
comprender cuales son los tipos de variables que existen. Esto por cuanto al referirnos a un
fenómeno en particular, como las características de una persona, algunas de ellas serán susceptibles
de medirse cuantitativamente mientras que otras no. Por ejemplo, el sexo de una persona se puede
determinar, aunque no se puede expresar cuantitativamente, más bien se puede delimitar a través de
las palabras hombre o mujer. Sin embargo, cuando hablamos del ingreso monetario de la persona,
dicha variable se puede expresar de forma cuantitativa, pues podemos decir que la persona tiene x
unidades monetarias, donde x es mensurable y se puede ordenar. Entonces, las variables se pueden
clasificar en variables cuantitativas y cualitativas (Webster, 2000).
Sin embargo, estas también se pueden clasificar en variables continuas y discretas, siendo las
primeras aquellas que pueden tomar cualquier valor dentro de un rango, como los valores
fraccionarios, y las segundas aquellas que solo pueden tomar ciertos valores, como la edad o
escolaridad de las personas (Webster, 2000).
También es posible hablar de variables ordinales y nominales. Las ordinales son aquellas que
tienen un orden o jerarquía pre-establecido, como por ejemplo el estatus socioeconómico, mientras
que las nominales son aquellas que no son susceptibles de ordenarse o jerarquizarse, tales como el
sexo, la pertenencia a un partido político, entre otras. (Levin y Levin, 1999: 4-5).
4.1.2. Algunas herramientas de medición.
La formulación de indicadores corresponde a la medición concreta de un fenómeno de interés. Para

esto se hace necesario plantear el objeto que se quiere medir, así como la lógica o el sentido en el
cual el indicador está midiendo dicho fenómeno. A continuación se revisan algunas herramientas
básicas para la construcción de indicadores. Esta sección se basa en Levin y Levin, (1999).
29
Proporciones: en la práctica no es posible analizar distribuciones que tienen el mismo número de
casos, razón por la cual los datos de dos muestras distintas se deben estandarizar. En consecuencia,
se puede convertir cualquier frecuencia en una proporción P, dividiendo el número de casos en
cualquier categoría dada f por el número total en la distribución N (Levin & Levin, 1999: 17). Ej.: la
proporción de alumnos con Notebook en la sala de clases.
𝑓𝑓
𝑃𝑃 = (4.1)
𝑁𝑁
Porcentaje: una forma de expresar la proporción en la lógica “por cada 100 casos” es expresarla en
porcentaje (Levin & Levin, 1999: 17). Ej.: el porcentaje de familias pobres en la comuna de Alhué.
𝑓𝑓
%= × 100 (4.2)
𝑁𝑁
Razones: otra forma de estandarizar es comparar el número de casos de una categoría (f 1 )

directamente con el número de casos de otra categoría (f 2 ) (Levin & Levin, 1999: 18). Ej.: la razón
entre casos de muerte por accidentes de tránsito y muertes por infarto al miocardio.
𝑓𝑓
𝑟𝑟𝑟𝑟𝑟𝑟ó𝑛𝑛 = 𝑓𝑓1 (4.3)
2
Tasas: comparan el número de casos reales (f reales ) respecto al número de casos potenciales
(f potenciales ) (Levin & Levin, 1999: 19). Ej.: la tasa de alumnos de educación municipal sobre los
alumnos en edad escolar.
𝑓𝑓𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟
𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝑓𝑓 × 1000 (4.4)
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
Tasa de variación: otra forma de medición que se usa bastante en ciencias sociales, y sobre todo en
economía es la tasa de variación o la variación porcentual de una variable (y) a través del tiempo.
Un ejemplo común es la tasa de variación del Producto Interno Bruto (PIB) del país, variable que
siempre aparece en la prensa y al cual las personas le prestan bastante atención. Dicha variación se
calcula como:
𝑦𝑦𝑡𝑡 −𝑦𝑦𝑡𝑡−1
𝑣𝑣𝑣𝑣𝑣𝑣% = � 𝑦𝑦𝑡𝑡−1
� × 100 (4.5)
Una vez entendidas estas herramientas básicas, es posible generar indicadores, como por ejemplo:
Ejemplo 1:
Objetivo: mejorar mis notas (𝑛𝑛𝑡𝑡 ) en la asignatura X.
Forma de medición: razón de notas = 𝑛𝑛𝑡𝑡+1 /𝑛𝑛𝑡𝑡
Meta: que las notas del periodo 2 (𝑛𝑛𝑡𝑡+1 ) sean un 1.3 de las notas del periodo 1 (𝑛𝑛𝑡𝑡 )
Resultado: si 𝑛𝑛𝑡𝑡 = 5 y 𝑛𝑛𝑡𝑡+1 = 6.5 => razón de notas = 𝑛𝑛𝑡𝑡+1 /𝑛𝑛𝑡𝑡 =6.5/5=1.3
Asimismo, es posible generar otro tipo de formas de medición, tales como la variación porcentual
de las notas, de la forma [(nt2-nt1)/nt1]*100. Entonces, reemplazando en el indicador 1, podemos
replantear la forma de medición y la meta.
Ejemplo 2:
Objetivo: mejorar mis notas (𝑛𝑛𝑡𝑡 ) en la asignatura X.
30
𝑛𝑛𝑡𝑡+1 −𝑛𝑛𝑡𝑡
Forma de medición: 𝑣𝑣𝑎𝑎𝑎𝑎% = � � 100
𝑛𝑛𝑡𝑡
Meta: que las notas del periodo 2 aumenten en un 30% respecto al periodo anterior (var%=30%)
Resultado: si 𝑛𝑛𝑡𝑡 = 5 y 𝑛𝑛𝑡𝑡+1 =6.1 => var% = ((6.1-5)/5)*100=22%
También es posible definir indicadores más complejos y sofisticados. Por ejemplo, quiero diseñar
un indicador tal, que su conformación mida el rendimiento global de la organización en la que
trabajo. Supongamos que las perspectivas a través de las cuales se mide el rendimiento de la
organización son la financiera, que pondera un 30%, y la de atención al usuario, que pondera un
70%. A su vez, cada perspectiva se mide de la siguiente forma:
𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑎𝑎𝑡𝑡 = porcentaje de presupuesto ejecutado al 31 de marzo del año t.

𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎ó𝑛𝑛 𝑎𝑎𝑎𝑎 𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑜𝑜𝑡𝑡 = número de becas otorgadas al 31 de marzo del año t, respecto de diciembre del año t-
1.
Si el porcentaje de presupuesto ejecutado al 31 de marzo del año t es de 40%, y el número de becas

otorgadas al 31 de marzo de t es de 30, mientras que en diciembre del año t-1 es de 200, el valor del
índice de rendimiento para este periodo (t) es de:
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑜𝑜𝑡𝑡 = (0.3)𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑎𝑎𝑡𝑡 + (0.7)𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎ó𝑛𝑛 𝑎𝑎𝑎𝑎 𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑜𝑜𝑡𝑡

30
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑜𝑜𝑡𝑡 = (0.3)0.4 + (0.7)
200
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑜𝑜𝑡𝑡 = 0.12 + (0.7)15
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑜𝑜𝑡𝑡 = 0.12 + 0.105 = 0.225
Por lo que el índice de rendimiento en el periodo t es de 22.5%. Este índice de rendimiento es

dinámico y varía a través del tiempo. Índices de tal tipo son la base del control de gestión en la
actualidad, y la base de los sistemas que llegan a conforman el Balanced Scorecard. Lo importante
es determinar las ponderaciones respectivas y la forma de medición de las variables.
4.1.3. Distribuciones en la organización de datos.
En estadística es frecuente ordenar los datos de formas útiles para el investigador. Un elemento
básico de este orden es el concepto de frecuencia, que dice relación con el número de veces que un
puntaje, valor o característica aparece en el conjunto de datos. Un ejemplo se puede observar en la
Tabla 4.1. En dicha tabla aparece el puntaje (p), que es la variable de interés, y en la columna f
aparece la frecuencia de dicha variable. Suponiendo que en este caso tenemos una población de 23
elementos, el puntaje 1 aparece 2 de 23 veces, mientras que el puntaje 6 aparece 3 de 23 veces. Sin
embargo, también se pude estudiar la frecuencia acumulada (fa), que no es más que la frecuencia
acumulada a nivel de cada puntaje. Por ejemplo, cuando el puntaje toma el valor 4, la frecuencia
acumulada toma el valor 14, lo que quiere decir que existen 14 casos iguales o menores a 4.
31
Tabla 4.1: Tabla de frecuencia simple para puntajes.
Puntajes (p) f fa fa/N
1 2 2 0.0870
2 3 5 0.2174
3 4 9 0.3913
4 5 14 0.6087
5 4 18 0.7826
6 3 21 0.9130
7 2 23 1.0000
Σ 23
Fuente: Levin y Levin (1999).
Una aplicación interesante de la frecuencia acumulada es que también se puede presentar en

términos porcentuales, por ejemplo, en la cuarta columna se tiene la frecuencia acumulada en forma
de proporción (fa/N), la que indica que por ejemplo el 8.7% ((fa/N)*100) de los casos presentan
puntajes de 1, mientras que el 78% de los casos presentan puntajes iguales o inferiores a 5. Como se
verá en la siguiente sección, la distribución acumulada es importante para obtener el rango
percentil.
Sin embargo, en estadística esta no es la única forma de presentar la información, es frecuente

también encontrarse con los datos en forma agrupada, u organizados en intervalos, como es el caso
de la Tabla 4.2, en la cual aparecen los datos de la Tabla 4.1 organizados en 3 intervalos. He aquí
que la frecuencia sea de 9 para el intervalo 1 a 3, y de 12 para el intervalo de 4 a 6. El concepto de
frecuencia acumulada tiene la interpretación usual. Sin embargo, en este caso se necesita una
medida representativa de cada intervalo, por lo que se recurre a la marca de clase (x), que
corresponde al promedio entre los límites de cada intervalo. Para el último intervalo es (7+9)/2=8.
Tabla 4.2. Tabla de Datos Agrupados para Puntajes

Intervalo x f fa
1a3 2 9 9
4a6 5 12 21
7a9 8 2 23
Σ 23
Fuente: elaboración propia en base a Tabla 4.1.
4.1.4. Rango Percentil.
En la Tabla 4.1 sé que la frecuencia acumulada porcentual del puntaje 6 es 91.3%, pero ¿qué ocurre
cuando tenemos datos agrupados? El rango percentil (RP) nos permite saber cuál es la frecuencia
acumulada exacta de cualquier puntaje. En la Tabla 4.3 aparecen puntajes organizados mediante
intervalos, y queremos saber el rango percentil de un puntaje específico.
32
Intervalo f fa fa/N
40-49 6 6 0.1224
50-59 7 13 0.2653
60-69 10 23 0.4694
70-79 12 35 0.7143
80-89 8 43 0.8776
90-99 6 49 1.0000
Σ 49
Para encontrar dicho RP es necesario aplicar la siguiente fórmula, definiendo para ello un intervalo
de análisis que denotaremos por I.
𝑓𝑓𝑎𝑎𝐼𝐼−1 𝑥𝑥−𝐿𝐿𝐼𝐼𝐼𝐼 𝑓𝑓
𝑅𝑅𝑅𝑅 = � 100� + � � � 𝐼𝐼 100� (4.6)
𝑁𝑁 𝑇𝑇𝐼𝐼 𝑁𝑁
Donde:
𝑓𝑓𝑎𝑎
� 𝐼𝐼−1 100�=frecuencia acumulada porcentual del intervalo anterior al intervalo de análisis.
𝑁𝑁
x = puntaje del cual queremos obtener el RP.
𝐿𝐿𝐼𝐼𝐼𝐼 = límite inferior del intervalo de análisis.
𝑇𝑇𝐼𝐼 = tamaño del intervalo de análisis.
𝑓𝑓
� 𝐼𝐼 100�= frecuencia relativa del intervalo de análisis.
𝑁𝑁
Entonces, queremos obtener el RP de un puntaje de 92. Primero se debe definir el intervalo de

análisis, y dicho puntaje se encuentra en el intervalo 90-99, por lo que este es I. Por otro lado,
sabemos que x=92, 𝐿𝐿𝐼𝐼𝐼𝐼 = 89.5 (Promedio entre 89 y 90), y 𝑇𝑇𝐼𝐼 = 10.
𝑓𝑓𝑎𝑎 𝑓𝑓 6
Finalmente, sabemos que � 𝐼𝐼−1 100� = (0.8776)100 = 87.76 , y que � 𝐼𝐼 100� = � 100� =
𝑁𝑁 𝑁𝑁 49
12.24. Aplicando finalmente la formula, queda:
92−89.5
𝑅𝑅𝑅𝑅 = (87.76 ) + � � (12.24)
10
𝑅𝑅𝑅𝑅 = 90.82
Por lo que el rango percentil de un puntaje 92 es de 90.82. Esto es, el 91% recibió un puntaje más
bajo que 92, y solo el 9.18% recibió un puntaje más alto (Levin y Levin, 1999).
La aplicación del percentil es de suma importancia, pues permite efectuar otros análisis más
sofisticados para medir la desigualdad en el ingreso. Por ejemplo, el p90/p10, que corresponde al
ratio entre el percentil 90 y el 10 de una distribución de ingresos, o los p90/p50, p10/p50 o
p75/p25.
4.2. Medidas de tendencia central:
Las medidas de tendencia central corresponden a estadísticos que resumen y permiten extraer
información de forma sintética de una muestra. Entre estos se tiene la moda, la mediana y el
promedio. Estos estadísticos a su vez, dependiendo de sus interrelaciones, permiten dar una idea de
la distribución con la que se está tratando.
33
Moda: puntaje o categoría que ocurre más frecuentemente en una distribución (Mo). Ej.: en las
siguientes muestras, ¿qué datos corresponden a la moda?
1, 4, 5, 6, 6, 9 => Mo=6
3, 2, 4, 5, 6, 7, 7, 3, 10, 14 => Mo=3 y 7.
Mediana: medida de tendencia central que corta la distribución en dos partes iguales (Mdn).
Amplias aplicaciones en diferentes campos (Teoría del votante mediano). Dado que en la mayoría
de los casos su posición no es tan clara, es conveniente encontrarla a través de la siguiente fórmula,
para lo cual los datos deben estar ordenados de forma ascendente:
𝑛𝑛+1
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃ó𝑛𝑛 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 = (4.7)
2
Un ejemplo de obtención de la mediana se encuentra en Levin y Levin (1999):
11, 12, 13, 16, 17, 20, 25 => (7+1)/2=4 lo que implica que la Mediana=16.
1, 2, 3, 4 => (4+1)/2=2,5 lo que implica que la Mediana=2.5
Media ( x ): la media o promedio de una muestra se define como el centro de gravedad de dicha
muestra, siendo el valor que resulta de dividir los diferentes valores de la muestra por el número de
casos. Es un estadístico bastante usado, corriente al sentido común, que permite dar una idea
“preliminar” respecto de los datos.
xi
x = ∑i =1
n
(4.8)
N
Ejemplo 1: Obtenga el promedio de la muestra A: 500, 600, 750, 810
xi 4 x x +x +x +x 500 + 600 + 750 + 810

x A = ∑i =1 = ∑i =1 i = 1 2 3 4 =
n
= 665
N N 4 4
Ahora, obtenga el promedio de la siguiente muestra, B: 1.000, 400, 595, 665
xi 4 x x + x + x + x 1000 + 400 + 595 + 665

x B = ∑i =1 = ∑i =1 i = 1 2 3 4 =
n
=?
N N 4 4
Observación 1: uno de los problemas que presenta la media, es que es altamente sensible a los
valores extremos de una muestra. Si se toma la fórmula de la media (4.8), se puede analizar lo
siguiente:
𝑋𝑋 +𝑋𝑋 +⋯+𝑋𝑋𝑁𝑁
𝑋𝑋� = 1 2
𝑁𝑁
1 1 1
𝑋𝑋� = 𝑋𝑋1 � � + 𝑋𝑋2 � � + ⋯ + 𝑋𝑋𝑁𝑁 � �
𝑁𝑁 𝑁𝑁 𝑁𝑁
Donde N corresponde al número de observaciones que tiene una muestra. Si se analiza la media, se
tiene que esta ofrece un índice en el cual cada observación tiene la misma ponderación, esto es
34
(1/N). Entonces, el promedio o media, dado que pondera de la misma forma a todas las
observaciones de la muestra, es altamente sensible a los valores extremos.
Relaciones entre Moda, Mediana y Media: la relación entre estos tres estadísticos puede arrojar
información de importancia respecto al conocimiento de una muestra. Para esto es necesario
entender que la x se ve fuertemente influenciada por los valores extremos, mientras que la moda se
da donde existe acumulación de valores (picos de la distribución normal).
Si Mo = Mdn = x => distribución simétrica

Si Mo < Mdn < x => distribución sesgada hacia la derecha
Si Mo > Mdn > x => distribución sesgada hacia la izquierda
Ejemplo 2: en las siguientes distribuciones, obtenga los valores de la moda, la mediana y el

promedio, y analice el sesgo de cada una.
Distribución X: 5, 6, 6, 7, 8, 9, 10, 10, 10

Distribución Y: 5, 6, 6, 7, 8, 9, 10, 10, 95
Distribución Z: 1, 2, 5, 5, 5, 5, 5, 6, 7
4.2.1. Medidas de Tendencia Central en Frecuencias de Distribución Simple
En la sección anterior analizamos las medidas de tendencia central en su forma más simple. Pero
¿Cómo podemos obtener dichos estadísticos cuando tenemos una frecuencia simple?. La dificultad
de obtención de cada medida variará en función de los cálculos que se requieran. En la Tabla 4.4 se
puede observar una frecuencia simple, sobre la base de Levin y Levin (1999: 40). Al observar
dicha tabla tenemos los puntajes en la primera columna 1, la frecuencia (f) en la segunda columna, y
la frecuencia acumulada (fa) en la tercera columna.
En este caso es fácil ver que la moda corresponde a 4, pues es el valor que más se repite en la
muestra, es decir, aparece 5 de 23 veces en los datos. Para obtener la mediana aplicamos la fórmula
de posición, esto es, (n+1)/2=12. Una vez que sabemos que la mediana se encuentra en la posición
12, solo tenemos que encontrar en qué puntaje se encuentra el dato n° 12. Esto ocurre cuando el
puntaje es igual a 4 (fa=14), por lo que la mediana es 4.
Para obtener el promedio, solo debemos ponderar cada puntaje por el número de veces que aparece
en la muestra, esto es, como aparece en la cuarta columna de la Tabla 4.4. Aplicamos la fórmula
siguiente:
∑ 𝑓𝑓𝑓𝑓 92
𝑥𝑥̅ = = =4
𝑛𝑛 23
1
En Levin & Levin (1999) la variable corresponde a puntajes, pero puede ser cualquier tipo de variable: Salarios en
millones de pesos, número de goles en partidos de futbol, código asignado a un individuo con ciertas características, etc.
35
Puntajes (p) f fa f*p
1 2 2 2
2 3 5 6
3 4 9 12
4 5 14 20
5 4 18 20
6 3 21 18
7 2 23 14
Σ 23 92
Fuente: Levin & Levin (1999).
Finalmente, podemos comprobar nuestros resultados generando una muestra de 23 datos y

calculando sobre ellos la moda, la mediana y la media. Un cálculo sencillo en Microsoft Excel
arroja para los datos de la Tabla 2, una moda=4, mediana=4 y promedio=4. (Otra vez…¿Cuál es el
sesgo de esta distribución?)
Tabla 4.5. Datos de la Tabla 1 en forma extensiva.
4.2.2. Medidas de Tendencia Central en Datos Agrupados.
¿Qué ocurre ahora cuando los datos se encuentran de forma agrupada?. Esto le añade complejidad
al análisis pues ahora no estaremos observando todos los datos, tal como aparecen en la Tabla 4.4 o
4.5, por el contrario, ahora observamos una agrupación del tipo que aparece en la Tabla 4.6. En
dicha tabla se ha incorporado x, que corresponde a la marca de clase o punto medio del intervalo
particular.
En este caso, dado que la moda corresponde al valor que más se repite en la muestra, tenemos que
la moda es 5, o en otras palabras, la moda corresponde al punto medio del intervalo que tiene mayor
frecuencia. La obtención del promedio es bastante simple, pues al igual que en el caso anterior, acá
debemos considerar la frecuencia del intervalo, pero considerando en este caso el punto medio. La
media queda entonces:
∑ 𝑓𝑓𝑓𝑓 94
𝑥𝑥̅ = = = 4.1
𝑛𝑛 23

Intervalo x f fa f*x
1a3 2 9 9 18
4a6 5 12 21 60
7a9 8 2 23 16
Σ 23 94
36
La mediana, dada su característica de ser el estadístico que divide a la muestra en dos partes iguales,
requiere un cálculo más preciso. En este caso consideramos la siguiente fórmula (Levin & Levin,
1999):
𝑛𝑛
−𝑓𝑓𝑓𝑓𝐼𝐼−1
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 = 𝐿𝐿𝐿𝐿𝐼𝐼 + 𝑇𝑇𝐼𝐼 � 2 𝑓𝑓𝐼𝐼
� (4.9)
Donde LI I corresponde al límite inferior del “intervalo de análisis”, 𝑇𝑇𝐼𝐼 al tamaño de dicho intervalo,
𝑛𝑛 al número de datos, 𝑓𝑓𝑓𝑓𝐼𝐼−1 a la frecuencia acumulada del intervalo anterior y 𝑓𝑓𝐼𝐼 a la frecuencia del
intervalo de análisis. Sin embargo, necesitamos definir qué se entiende por “intervalo de análisis”.
Dicho intervalo es el intervalo más probable que contiene a la mediana. Para obtenerlo se aplica la
siguiente regla: n/2. Aplicando la regla, se tiene que n/2=11.5. Analizando la fa de la Tabla 4.6,
concluimos que dicho valor se encuentra en el intervalo [4 - 6], pues en él van acumulados 21 datos.
Aplicando la fórmula al caso de la Tabla 4.6 se obtiene:
11.5−9
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 = 3.5 + 3 � �
12
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 = 3.5 + 0.625 = 4.125
Finalmente, obtenemos que en este caso la mediana es 4.125.
4.3. Medidas de dispersión:
Las medidas de dispersión corresponden a estadísticos que permiten analizar la variabilidad o

heterogeneidad de una muestra determinada. Esta variabilidad se estima a través de diferencias
respecto de la media de la distribución.
Rango: Es el estadístico básico de dispersión y consiste en la resta entre el valor más alto y el valor
más bajo de la distribución.
Rango: X max –X min (4.10)
Por ejemplo, supongamos que estamos estudiando el porcentaje de pobreza en las comunas de
Chile, y observamos que en nuestra base de datos la comuna con menor pobreza tiene un porcentaje
de 0% de pobres, mientras que la comuna con mayor pobreza tiene un porcentaje de pobres de 49%,
el rango del índice de pobreza comunal es de 49%-0%=49%.
Desviación estándar: Corresponde al estadístico que mide la dispersión de una muestra como el
valor promedio de las desviaciones respecto a la media. Sirve para estimar la heterogeneidad o
volatilidad de una muestra de datos.
∑
n
( xi − x ) 2
σ= i =1
(4.11)
N
Ejemplo 1: estime la desviación estándar de las siguientes muestras:
A: 500, 600, 750, 810

B: 1.000, 400, 595, 665
37
¿Qué muestra tiene una mayor dispersión? ¿Qué relación tiene este cálculo respecto de la obtención
de promedios de la sección anterior?
Varianza: corresponde al cuadrado de la desviación estándar. Le da mayor peso a los valores

extremos.
∑
n
( xi − x ) 2
σ 2
= i =1
(4.12)
N
Coeficiente de variación (CV): corresponde a la razón entre la desviación estándar y el promedio.

Sirve para estandarizar la dispersión cuando tenemos dos muestras en distintas escalas.
σ
CV = (4.13)
x
Ej.: se tienen dos muestras,
B: 2, 4, 10,
C: 2000, 4000, 2000.
El promedio y la desviación estándar de la muestra B corresponden a 5.33 y 3.4, y el promedio y la

desviación estándar de C corresponden a 2,667 y 943. ¿Qué distribución tiene una mayor dispersión
según la desviación estándar? ¿y según el CV?.
Observación 1: Una forma más intuitiva de comprender por qué se usa el CV es suponer que se
tiene la desviación estándar de la muestra Y, la que toma el valor 𝜎𝜎𝑌𝑌 . Supongamos ahora que todos
los datos de la muestra Y se multiplican por 1000, generando la muestra Z, la que tiene a su vez una
desviación estándar, 𝜎𝜎𝑍𝑍 . En la práctica, lo que ocurre es que la desviación estándar de Y se termina
multiplicando por 1000, esto es:
∑(1000𝑥𝑥𝑖𝑖 −1000𝑥𝑥̅ )2
𝜎𝜎𝑍𝑍 = �
𝑛𝑛
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2
𝜎𝜎𝑍𝑍 = �10002 𝑛𝑛
𝜎𝜎𝑍𝑍 = √10002 �
𝑛𝑛
𝜎𝜎𝑍𝑍 = 1000� 𝑛𝑛
𝜎𝜎𝑍𝑍 = 1000𝜎𝜎𝑌𝑌
Entonces, se hace evidente que la desviación estándar depende de las unidades de medida de la
variable, por lo que se hace necesario un estadístico que sea a-dimensional, o invulnerable a las
unidades de medida, como el CV.
Ejemplo 2: En el ciclo económico uno de los componentes del PIB que más varía es la inversión.
De ahí que la hipótesis es que si se estima algún estadístico de dispersión sobre los componentes del
PIB, este estadístico debería indicar que la inversión tiene una mayor variabilidad en el tiempo. En
el Gráfico 4.1 se observan los componentes del PIB para Chile, considerando el periodo 1980-1995.
38
En el gráfico se observa que la magnitud del consumo es mucho mayor a la de la inversión, por lo
que quizá, la desviación estándar del consumo termine siendo mayor a la de la inversión.
Gráfico 4.1: Componentes del PIB 1980-1995, Chile.

Millones de pesos de 2005 (MM$2005)
Fuente: elaboración propia en base a Braun, Juan et al (2000).
En la Tabla 4.7 se puede observar la desviación estándar del consumo, la que alcanza la cifra de
2,759,022, muy superior a la de la inversión, 1,482,769. En este caso, la desviación estándar no
representa el hecho de que la inversión debiese ser más volátil. Es por eso que se estima el
coeficiente de variación, el que presenta una mayor volatilidad para la inversión respecto del
consumo.
Tabla 4.7. Estadística Descriptiva de Componentes del PIB, 1980-1995, Chile.

Millones de pesos de 2005 (MM$2005)
Consumo Inversión Gasto de Exportaciones
Estadístico
Privado Total Gobierno Netas
𝑥𝑥̅ 10,164,447 3,213,594 2,111,575 741,129
𝜎𝜎 2,759,022 1,482,769 200,605 688,978
CV 0.27 0.46 0.10 0.93
Fuente: elaboración propia en base a Braun, Juan et al (2000).
4.3.1. Medidas de Dispersión Frecuencias de Distribución Simple.
Al igual que el caso de las medidas de tendencia central, en el caso de las medidas de dispersión
también nos encontramos con casos en los cuales se deben analizar frecuencias simples, por lo que
el cálculo de los estadísticos varía. En la Tabla 4.7 se tienen los mismos datos de la Tabla 4.4, pero
en este caso calcularemos las medidas de dispersión.
En primer lugar, el rango de la frecuencia simple es igual a 7-1=6. Del apartado anterior sabemos
que la desviación estándar se calcula como la raíz del promedio de las desviaciones respecto a la
media al cuadrado. Sin embargo, recurriendo al algebra, podemos encontrar una forma más simple
de calcular la desviación estándar.
39
Puntajes (p) F fa f*p f*p2
1 2 2 2 2
2 3 5 6 12
3 4 9 12 36
4 5 14 20 80
5 4 18 20 100
6 3 21 18 108
7 2 23 14 98
Σ 23 92 436
Recordando la fórmula de la desviación estándar (4.11), tenemos lo siguiente:
𝜎𝜎 = � 𝑛𝑛
Dado que al interior de la formula existe un cuadrado de binomio, podemos tomar dicha expresión y
desarrollarla:
∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )2
∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )
∑(𝑥𝑥𝑖𝑖2 − 2𝑥𝑥̅ 𝑥𝑥𝑖𝑖 + 𝑥𝑥̅ 2 )
Aplicando la sumatoria en la expresión, nos queda:
Σ𝑥𝑥𝑖𝑖2 − Σ2𝑥𝑥̅ 𝑥𝑥𝑖𝑖 + Σ𝑥𝑥̅ 2 (4.14)
Dejando las constantes por delante de la sumatoria, se obtiene (2.3):
Σ𝑥𝑥𝑖𝑖2 − 2𝑥𝑥̅ Σ𝑥𝑥𝑖𝑖 + Σ𝑥𝑥̅ 2 (4.15)
Dado que el promedio al cuadrado corresponde a una constante, esto es, puede ser igual 25, la
sumatoria de dicho valor es igual a n veces 25, esto es, n*25. Por otro lado, como Σ𝑥𝑥𝑖𝑖 = 𝑥𝑥̅ ∗ 𝑛𝑛,
entonces:
Σ𝑥𝑥𝑖𝑖2 − 2𝑥𝑥̅ 𝑥𝑥̅ ∗ 𝑛𝑛 + 𝑛𝑛𝑥𝑥̅ 2
Σ𝑥𝑥𝑖𝑖2 − 2𝑥𝑥̅ 2 𝑛𝑛 + 𝑛𝑛𝑥𝑥̅ 2
Σ𝑥𝑥𝑖𝑖2 − 𝑥𝑥̅ 2 𝑛𝑛 (4.16)
Luego, reemplazando la expresión (4.16) en (4.11) nos queda:
Σ𝑥𝑥𝑖𝑖2
− 𝑥𝑥̅ 2 (4.17)
Σ𝑓𝑓𝑓𝑓𝑖𝑖2
− 𝑥𝑥̅ 2 (4.18)
40
Donde 4.17 es la expresión alternativa para calcular la desviación estándar, y 4.18 es la expresión
para calcular la desviación estándar en los casos de frecuencia simple. De hecho, aplicando la
fórmula 4.18 sobre los datos de la Tabla 4.7, tomando en consideración que la media estimada es 4,
y que x es p, tenemos lo siguiente:
− 𝑥𝑥̅ 2
436
𝜎𝜎 = � − (4)2 = 1.72
23
Por lo que la desviación estándar corresponde a 1.72. Dado que la varianza es el cuadrado de la
desviación estándar, se tiene que 𝜎𝜎 2 = 2.96. Por último, el coeficiente de variación es igual a
CV= 𝜎𝜎 /𝑥𝑥̅ , por lo que CV=0.43.
4.3.2. Medidas de Dispersión en Datos Agrupados.
Para el caso de los datos agregados, tendremos datos como en la Tabla 4.8, clasificados por
intervalo, por lo que nuevamente se debe calcular la marca de clase o punto medio (x). Observando
la tabla, se tiene que el rango corresponde a 7-1=6. Para calcular la desviación estándar, se recurre
nuevamente a la formula derivada en el apartado anterior:
− 𝑥𝑥̅ 2
464
𝜎𝜎 = � − (4.1)2 = 1.83
23

Intervalo x f fa f*x f*x2
1a3 2 9 9 18 36
4a6 5 12 21 60 300
7a9 8 2 23 16 128
Σ 23 94 464
Por lo que la varianza corresponde a 𝜎𝜎 2 = 3.35, y el coeficiente de variación es de CV=0.45.
4.4. Distribución normal.
Los conceptos tratados anteriormente permiten introducir una de las distribuciones más usadas en el
trabajo empírico, la distribución normal. Entre las características de esta distribución se tiene que es
simétrica, es decir, a partir de la media, se acumula la misma cantidad de datos hacia la izquierda y
la derecha. En segundo lugar, es una distribución unimodal (Levin y Levin, 1999). En el gráfico 4.2
se observa una curva normal, donde en el eje de las abscisas están los valores que puede tomar una
variable, mientras que en el eje de las ordenadas esta la frecuencia. En el eje de las abscisas se
pueden observar desviaciones respecto de la media en unidades de desviación estándar; esto es, 1
implica una distancia de una desviación estándar hacia la derecha respecto de la media, mientras
que 2 implica dos desviaciones estándar hacia la derecha respecto de la media. Por el contrario, -3
41
quiere decir 3 desviaciones estándar hacia la izquierda de la media. Dichas distancias son relevantes
pues permiten definir las siguientes áreas de acumulación:
Entre -1σ y 1σ => 68,26%

Entre -2σ y 2σ => 95,44%
Entre -3σ y 3σ => 99,74%
De acuerdo a lo anterior, entre la media y una desviación estándar hacia la derecha, se encuentra el
34.13% de los datos (68.26/2=34.13), entre la media y dos desviaciones estándar hacia la derecha se
encuentra el 47.72% de los datos (95.44/2=47.72), y entre la media y tres desviaciones estándar
hacia la derecha se encuentra el 49.87% de los datos (99.74/2=49.87).
Gráfico 4.2. Distribución normal y el área acumulada bajo la curva.

Frecuencia
-3 -2 -1 x 1 2 3
Fuente: Elaboración propia usando el software STATA.
Sin embargo, dado que las distancias definidas por sumas o restas de desviaciones estándar respecto
de la media no son los únicos casos que se tienen en la curva normal, es factible obtener los
porcentajes de acumulación de cualquier distancia respecto de la media usando la siguiente fórmula
(Levin y Levin, 1999):
xi − x
Z= (4.19)
σ
Donde Z = puntaje estandarizado.

𝑥𝑥𝑖𝑖 = variable a estandarizar.
𝑥𝑥̅ = media.
𝜎𝜎 = desviación estándar
Ejemplo 1: la distribución de las notas de un curso presenta una media de 4 y una desviación
estándar de 1.72. Si se supone que la distribución está normalmente distribuida, la nota 6.0 tiene el
siguiente orden Z:
𝑥𝑥𝑖𝑖 −𝑥𝑥̅
𝑧𝑧 = 𝜎𝜎
6−4
𝑧𝑧 = = 1.16
1.72
Esto a su vez implica que es posible elegir percentiles a discreción, lo que nos lleva a hablar del
concepto de confianza y que es útil en inferencia estadística. Si queremos hacer un análisis al 90%
de confianza, los valores -1,645 y +1,645 en el eje de las abscisas acumulan el 90% de la
42
probabilidad. El análisis es análogo para los niveles de confianza de 95% (-1,96; +1.96), y 99% (-
2.58; +2.58).
4.4.1. Probabilidades en la curva normal.
La curva normal nos permite hablar de probabilidades. Una probabilidad se define como la relación
entre el número de veces que un evento puede ocurrir y la cantidad total de eventos. En este caso,
podemos entender el área de la curva normal como un área de probabilidad total, y las sumas/restas
de desviaciones estándar, o los puntajes Z¸ como áreas que definen la acumulación de
probabilidades.
La probabilidad tiene tres propiedades importantes. La primera implica que la probabilidad siempre
se encuentra entre 0 y 1. La segunda dice relación con la regla de la suma, que implica que “la
probabilidad de obtener un resultado cualquiera entre varios diferentes es igual a la suma de sus
distintas probabilidades” (Levin y Levin, 1999). Esto implica en el ejemplo de los puntajes que la
4 3 2 9
probabilidad de obtener un 5, un 6, o un 7 es de + + , lo que equivale a , es decir, a una
23 23 23 23
probabilidad de de 0.3913.
Una tercera propiedad es la regla de la multiplicación¸ que se usa para casos en los cuales los
eventos ocurren en forma sucesiva. Esta regla implica que “la probabilidad de obtener una
combinación de resultados que se excluyen mutuamente, es igual al producto de sus probabilidades
por separado” (Levin y Levin, 1999). Por ejemplo, ¿cuál es la probabilidad de obtener el mismo
número al lanzar el dado dos veces seguidas?. La probabilidad de obtener un número al lanzar el
1
dado (de 6 caras) es de , mientras que la probabilidad de obtener el mismo número al lanzarlo
6
1
nuevamente es de 6. Entonces, la probabilidad de obtener el mismo número dos veces seguidas es
1 1 1
igual a 6 × 6 = 36, es decir, 0.03.
Ejemplo 2: utilizando el ejemplo 1, es posible obtener la probabilidad de que la persona que se

seleccione de la muestra tenga una nota entre la media y 6.0. Consultando la tabla de probabilidad
de la distribución normal podemos saber exactamente cuál es la probabilidad acumulada de 1.16, la
que corresponde a 37.70% desde la media, y a 87.70% de probabilidad acumulada total
(37.75+50=87.75) 2. Entonces, la probabilidad de obtener una nota entre la media y 6.0 es de
37.70%.
Es más, también es posible obtener la probabilidad de que la nota este sobre 6.0, y para esto solo
debemos restar a 50, la probabilidad obtenida para 1.16, esto es 50-37.70=12.3. Esto es, la
probabilidad de obtener una nota por sobre 6.0 es de 12.3%.
El teorema del límite central: Un fuerte argumento para usar la distribución normal es el teorema
del límite central. A medida que se extraen suficientes muestras de una población, la distribución de
la media muestral se aproximará a una normal, en forma independiente al tamaño de las muestras
(Soto, 2010). Esto es, si extraigo bastantes muestras de una población, y se calcula le media de cada
una de esas muestras, la distribución de dichas medias se distribuirá normal, siempre que el número
de extracciones sea grande. Y es independiente del tamaño de las muestras.
2
Es relativamente simple obtener la probabilidad acumulada total con el software Excel. Para este caso basta
con introducir en una celda la siguiente fórmula: =DISTR.NORM.ESTAND(1.16), la que dará por resultado
0.8770.
43
4.5. Otros conceptos de relevancia en la Estadística Descriptiva.
Una distribución de probabilidad a menudo puede resumirse en términos de algunas de sus

características, conocidas como los momentos de la distribución. Dos de los momentos más
utilizados son la media y la varianza (Gujarati, 1997), que corresponden al primer y segundo
momento de una distribución.
Sin embargo, a través de los momentos tercero y cuarto es posible construir dos indicadores, uno de
asimetría y otro de apuntamiento.
Coeficiente de asimetría (CA) o Skewness:
n  xi − x 
3
n
CA =
(n − 1) * (n − 2)
∑i =1 
 s 

(4.20)
Respecto a curtosis, el indicador corresponde a:
 n(n + 1) n  xi − x  
4
3(n − 1) 2
Curtosis =  ∑i=1  s  (n − 2)(n − 2)
   − (4.21)
 (n − 1)(n − 2)(n − 3) 
Los valores que toma cada uno de estos indicadores define la forma de la distribución. Por ejemplo,
cuando CA>0 tenemos una distribución con sesgo derecho, mientras que si CA<0, la distribución
tiene sesgo izquierdo. Por otro lado, respecto al cuarto momento, la forma de la curva normal
presenta una curtosis=3, por lo que si curtosis>3 la distribución tiene un grado de apuntamiento
mayor a la normal (leptocúrtica), y si curtosis<3 la distribución tiene un grado de apuntamiento
menor a la normal (platicúrtica).
¿Tienen alguna relación estos conceptos con las relaciones entre las medidas de tendencia central
media, mediana y moda? Para responder a esta pregunta es posible acudir a la estadística descriptiva
de 3 variables tipo. En la Tabla 4.9, para la variable X, la media es casi idéntica a la mediana,
mientras que skewness y curtosis implican un leve sesgo negativo y menor grado de apuntamiento
que la normal, respectivamente. Para la variable Y, la media es bastante mayor a la mediana, y
skewness y curtosis presentan sesgo derecho y un elevado grado de apuntamiento, respectivamente.
44
Tabla 4.9. Estadística Descriptiva, variables X y Y.
sum, detail
x
-------------------------------------------------------------
Percentiles Smallest
1% 5 5
5% 5 6
10% 5 6 Obs 9
25% 6 7 Sum of Wgt. 9
50% 8 Mean 7.888889

Largest Std. Dev. 1.964971
75% 10 9
90% 10 10 Variance 3.861111
95% 10 10 Skewness -.1518817
99% 10 10 Kurtosis 1.479504
y
-------------------------------------------------------------
Percentiles Smallest
1% 5 5
5% 5 6
10% 5 6 Obs 9
25% 6 7 Sum of Wgt. 9
50% 8 Mean 17.33333

Largest Std. Dev. 29.18047
75% 10 9
90% 95 10 Variance 851.5
95% 95 10 Skewness 2.456778
99% 95 95 Kurtosis 7.073819
Referencias
Braun, Juan et al (2000), Economía Chilena 1810-1995. Estadísticas Históricas, Documento de

Trabajo, Instituto de Economía, Universidad Católica de Chile.
Levin, Jack; Levin, William C. (1999). “Fundamentos de Estadística en la Investigación Social”.

Oxford University Press. Segunda Edición.
Soto, Raimundo (2010). “Notas de Clases, Teoría Econométrica”. Trabajo Docente N° 78. Instituto
de Economía, Pontificia Universidad Católica de Chile. ISSN: 0717-7593.
Webster, Allen (2000). “Estadística aplicada a los negocios y la economía”. Tercera Edición.
McGraw-Hill Interamericana, S.A. Santa Fe de Bogotá, Colombia.
45
1. Usted tiene los siguientes datos de PIB (Y) a precios constantes. Determine las tasas de
variación del PIB del periodo 2010 respecto a 2009, 2008 a 2007, y 2010 respecto a 2007.
Y 2007 =1000, Y 2008 =1130, Y 2009 =1456, Y 2010 =1278.
2. Suponga que tiene las siguientes muestras (A y B) de números:
A= 10, 22, 3, 14, 5, 6, 7

B=1, 4, 5, 8, 8, 3, 4
Obtenga los promedios de ambas muestras. ¿Qué muestra tiene una mayor dispersión?
3. Suponga que tiene dos países, A y B, conformados por 5 habitantes (i, ii, iii, iv, y v) y sus
respectivos ingresos en la Tabla 1
Tabla 1
personas Pais A Pais B
i 100 20
ii 50 23
iii 30 70
iv 20 96
v 30 40
a) ¿Cuál es el ingreso promedio ( y ) de cada País, y que proporción representa el ingreso

promedio del País A sobre el País B?
b) ¿Qué porcentaje representa el ingreso promedio del País B respecto al ingreso promedio del
País A?
c) Lleve a escala de 0 a 1 los ingresos de los dos países, donde 0 corresponda a la cifra mínima
de ingreso y 1 a la cifra máxima. ¿Cuál de los países presenta una mayor dispersión del
ingreso?
d) Investigue respecto del coeficiente de Gini y presente una definición conceptual en no más
de 5 líneas. ¿Cree que sirve ese estadístico para este análisis? Fundamente.
4. Usted se enfrenta a la decisión de tomar un programa de postgrado en el área de la gestión

pública. En la Tabla 2 tiene datos respecto a las diferentes universidades que llevan a cabo
el programa.
Tabla 2
Universidad Prestigio Tasa de reprobación Posibilidades de Cercanía al hogar
(encuesta) (1er año) encontrar trabajo (km)
U. de Y 0 30% 50% 10
U. de X 1 20% 90% 4
U. de Z 2 15% 65% 5
U. de W 1 50% 100% 8
Suponga que usted desea efectuar la mejor elección posible, pero para eso debe observar
sus preferencias. Quiere el máximo prestigio posible, lo que le importa en un 40%. Dado
que usted es un alumno esforzado, no le interesa la reprobación, pues usted es capaz de
asumir el desafío, razón por la que ésta le importa solo un 5% (sin embargo, si la
universidad tiene el nivel más alto en ranking, ésta le importa 0%). Las posibilidades de
trabajo le importan un 30%, sin embargo, si se trata de la mejor universidad, usted le exigirá
46
más al prestigio, razón por la cual le asignará una ponderación de 35%. Respecto a la
cercanía al hogar, mientras más cerca mejor.
Plantee un índice para efectuar la mejor elección. Considere la inversa proporcional cuando
el sub-indicador lo requiera.
5. Tiene los siguientes índices de pobreza para dos países, Z e Y, para tres años, ¿en cuál de
los dos países existe una mayor variabilidad de la pobreza? Ocupe todos los estadísticos de
dispersión.
Z: 3%, 5%, 5%
Y: 5%, 7%, 6%
6. “Hay dos panes. Usted se come dos. Yo ninguno. Consumo promedio: un pan por persona”.
Nicanor Parra
Utilice la frase de Nicanor Parra y compárela con una situación en la cual haya igualdad total en
el consumo de los dos panes (2 personas, 2 panes). ¿Qué puede decir respecto de la desigualdad
usando el promedio y la desviación estándar? ¿Aporta el análisis del coeficiente de gini?
7. Si el coeficiente de variación de una muestra es de 3 y su desviación estándar es (100/300)-1

¿Cuál es la media de dicha muestra? ¿Cuál es la varianza?
8. Usted es el jefe del Departamento de Estudios de cierto organismo público. Dentro de los
productos estratégicos de dicho organismo está la entrega de subsidios de arancel
universitario para aquellos jóvenes de buen rendimiento académico y escasos recursos.
Estos subsidios se entregan en base a los resultados obtenidos en la educación secundaria.
El Jefe del Departamento de Subsidios (DESUB), le encarga a usted resolver la forma de asignar los
recursos en la muestra de jóvenes inscritos en el programa. Solo se puede asignar el subsidio a dos
estudiantes, razón por la que la asignación debe estar muy bien fundamentada.
Usted dispone de la siguiente base de datos:
Tabla 3
Notas Notas Notas Notas
Primero Segundo Tercero Cuarto Ingreso Personas
Nombre Medio Medio Medio Medio Familiar en el Hogar
Manuel 5 5 5.4 7 100 3
Josefina 3 4 5 6.5 200 4
Andrés 6 6.1 6.2 6.2 150 3
Raúl 6 6.5 6.4 6.6 430 6
Clotilde 4 6 7 6 300 5
a) El Jefe del DESUB no sabe de estadísticas ni métodos cuantitativos, razón por lo que le
pide a usted asignar los subsidios de acuerdo al promedio de notas de los 4 años de
enseñanza secundaria.
b) El Jefe del DESUB, confundido con su decisión, se acerca nuevamente a usted, y le

propone asignar mejor los subsidios de acuerdo al grado de superación anual en el
rendimiento de los estudiantes.
47
c) A esta altura, el Jefe del DESUB tiene un ataque de nervios, pues un asesor le comentó que
no está cumpliendo con los productos estratégicos de la organización, pues no ha
considerado la variable “escasos recursos” en el análisis. Debido a esto, le pide a usted que
distribuya los subsidios considerando el ingreso. En caso de existir problemas, se le pide
que decida en base al grado de superación anual.
d) Frente al problema anterior, un asesor le propone dirimir el subsidio en base al nivel de

riesgo de los alumnos, considerando como riesgo la variabilidad en las notas.
e) Un profesional de otro departamento le recomienda a usted usar el siguiente ratio para

asignar el subsidio: ratio = (promedio de notas) / (ingreso per cápita). Haga el ejercicio y
discuta de la conveniencia de usar este método.
f) ¿Se le ocurre a usted otro método? ¿Qué solución propone? (Opcional: 3 respuestas más
creativas tendrán 5 décimas en la prueba)
9. Las predicciones de terremoto del Comando de Predicciones Internacionales de Terremotos

(CPIT) y del Red Alert Quake (RAQ) son las siguientes, donde Pi corresponde a la
predicción “i”:
P1 P2 P3 P4
CPIT 7,5 7,4 7,5 7,2
RAQ 8 6,5 7 4
Dado que cada organismo ha estimado los terremotos usando sus propias metodologías en forma
constante sobre diferentes muestras de datos, se le pide hacer un estudio descriptivo de las
predicciones.
a) Aplique todas las medidas de tendencia central vistas en clase.

b) Aplique todas las medidas de dispersión vistas en clase.
c) ¿Qué estimación parece más confiable? ¿Por qué?
10. Si al promedio de una muestra normal le suma ¼ de la desviación estándar. ¿dentro de que
intervalo, en términos del promedio y la desviación estándar, se encuentra dicho valor?
11. Usted quiere estimar un promedio ponderado de rendimiento a partir de las evaluaciones de
tres organizaciones del sector público. Estas evaluaciones son buenas (b), super buenas
(sb), y excelentes (e). Si para usted las evaluaciones buenas valen 10, las evaluaciones
super buenas valen 30, y las evaluaciones excelentes valen:
Peso evaluaciones b*(Peso evaluaciones sb)1/2
Determine la evaluación ponderada de cada organismo en base a la tabla de evaluaciones

siguiente:
Organismo buenas Super buenas excelentes

Ministerio de Salubridad 100 80,1 99,3
Ministerio de Instrucción 99,4 90 93
Ministerio de Desarrollo 95,01 97 93,2
48
5. Medidas de Asociación.
5.1. Intuición de las medidas de asociación.
Hasta el momento nos hemos enfocado en el análisis básico de estadística descriptiva con una
variable. Es decir, se ha hecho una revisión aplicada de estadísticos de tendencia central, tales como
la moda, la mediana, y el promedio, y de estadísticos de dispersión, tales como el rango, la
desviación estándar, la varianza, y el coeficiente de variación.
Sin embargo, en la realidad suelen observarse fenómenos que implican la interacción de dos o más
variables, tales como la relación entre la escolaridad y los ingresos que percibe una persona, el
desempleo y los índices de pobreza, los precios de un mercado particular y las cantidades
demandadas.
Por ejemplo, en las primeras sesiones conformamos un índice de medición del rendimiento
educacional, tal como ((𝑛𝑛𝑡𝑡+1 -𝑛𝑛𝑡𝑡 )/ 𝑛𝑛𝑡𝑡 )*100, donde 𝑛𝑛𝑡𝑡+1 corresponde a las notas del periodo futuro y
𝑛𝑛𝑡𝑡 a las notas del periodo actual. Si el resultado de este indicador corresponde a un porcentaje
mayor a 0%, quiere decir que el rendimiento educacional está evolucionando de forma positiva.
Sin embargo, ¿Qué determina dicha variación positiva del rendimiento educacional que se mide a
través de la evolución de las notas?. Antes de efectuar un análisis un poco más exhaustivo, tal como
el que se propone una investigación, es necesario observar relaciones básicas entre las variables,
con el objeto de establecer alguna hipótesis relevante.
En este panorama se tienen los estadísticos de asociación, entre los cuales se encuentra la co-
varianza y el coeficiente de correlación. Si bien estos dos estadísticos se distribuyen de diferente
forma, valores elevados en valor absoluto dicen relación con altos grados de correlación o
evolución lineal entre las variables.
5.2. Estadísticos de asociación (Covarianza, Coef. de Correlación).
Dado que en la realidad existen fenómenos que implican la asociación entre dos o más variables, es
necesario conocer las herramientas que permiten conocer y medir dicha asociación. Dichas
herramientas pueden ser intuitivas y específicas.
En la Tabla 5.1 tenemos datos de ingreso y escolaridad. Aquí la hipótesis principal, presente en gran
parte de la literatura de capital humano, es que a mayor escolaridad existe un mayor retorno de la
educación, medido ese retorno en este caso, por el nivel de ingreso. La primera aproximación es
utilizar una herramienta intuitiva, tal como el análisis gráfico (Gráfico 5.1).
Tabla 5.1. Ingreso y Escolaridad

Escolaridad (X) Ingreso (Y)
9 10
8 11
6 5
7 8
7 7
4 5
3 3
2 1
49
Grafico 5.1: Ingreso y Escolaridad.
10
Ingreso (Y)
5 0
2 4 6 8 10
Escolaridad (X)
Fuente: Elaboración propia en base a 5.1.
Si bien el análisis gráfico permite establecer un grado de relación entre las variables, también es
necesario contar con herramientas formales, que permitan establecer en forma específica el nivel de
correlación entre las variables.
5.2.1. Covarianza
La covarianza corresponde a una medida de asociación que se construye a partir de las diferencias
respecto a la media de cada variable, en este caso, X e Y, por lo que establece una relación entre sus
variabilidades.
Respecto a la variabilidad, recordemos el estadístico usado para medir la dispersión de una muestra
como la desviación estándar:
∑
n
( xi − x ) 2
σx = i =1
(5.1)
N
Sin embargo, otra medida dice relación con la varianza, la que tiene una relación cuadrática con la
desviación estándar:
∑
n
( xi − x ) 2
σ 2
x = i =1 (5.2)
N
∑
n
( xi − x )( xi − x )
σ 2
x = i =1
(5.3)
N
Al analizar la fórmula de la varianza, podemos ver que la forma de medir la dispersión dice relación
con el cuadrado de las desviaciones respecto de la media. El cuadrado es una forma de neutralizar
los valores negativos que se obtienen de las diferencias, pues, los valores se encuentran por abajo y
por arriba de la media. Entonces, a medida que estos valores estén más lejos de la media, hacia
abajo y hacia arriba, se incremente la variabilidad.
Sin embargo, podemos hacer una transformación útil, que implica cambiar el segundo componente
de la sumatoria por y. Al hacer esta transformación, inmediatamente obtenemos la covarianza, que
mide la variabilidad entre las variables x e y, y cuya fórmula viene definida por (Spiegel, 1976: 82):
50
∑
n
( xi − x )( yi − y )
σ xy = i =1
(5.4)
N
Al analizar la ecuación 5.4 se tiene que si el valor de x esta por sobre su media el resultado será un
valor positivo, asimismo, si y esta por sobre su media también tendrá un valor positivo, y su
producto (𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 − 𝑦𝑦�), tendrá un valor positivo. Si por el contrario, x está por debajo de su
media, e y por arriba de su media, su producto (𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 − 𝑦𝑦�) tendrá un valor negativo. Este es el
sentido de la covarianza.
Al hacer operar la covarianza con los datos de la Tabla 5.1, se tiene lo siguiente:
Tabla 5.2. Ingreso y Escolaridad

N Escolaridad Ingreso ( xi − x ) ( yi − y) ( xi − x )( yi − y )
(X) (Y)
1 9 10 3.25 3.75 12.1875
2 8 11 2.25 4.75 10.6875
3 6 5 0.25 -1.25 -0.3125
4 7 8 1.25 1.75 2.1875
5 7 7 1.25 0.75 0.9375
6 4 5 -1.75 -1.25 2.1875
7 3 3 -2.75 -3.25 8.9375
8 2 1 -3.75 -5.25 19.6875
∑
n
x, y 5.75 6.25 ( xi − x )( yi − y ) 56.5
i =1
σ x ,σ y ∑
n
2.33 3.19 ( xi − x )( y i − y ) / N 7.0625
i =1
Fuente: Elaboración propia en base a 5.1
Entonces, 𝜎𝜎𝑥𝑥𝑥𝑥 =7,0625, lo que quiere decir que existe una relación de carácter positivo entre las
variables x e y. Si por el contrario, el resultado de ∑𝑛𝑛𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 − 𝑦𝑦�) fuera negativo, entonces la
covarianza seria negativa.
Entonces, −∞ < 𝜎𝜎𝑥𝑥𝑥𝑥 < +∞, con lo que la covarianza da una medida de evolución lineal entre las
variables que se distribuye entre el menos infinito y el más infinito. Cabe destacar que la covarianza
se puede estimar también de la siguiente forma:
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 −𝑦𝑦�) 𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖

𝜎𝜎𝑥𝑥𝑥𝑥 = 𝑁𝑁
=∑ − 𝑥𝑥̅ 𝑦𝑦� (5.5)
𝑁𝑁
Para llegar a la expresión 5.5, se puede partir de 5.4, de la siguiente forma:
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 −𝑦𝑦�)

∑(𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖 −𝑥𝑥𝑖𝑖 𝑦𝑦�−𝑥𝑥̅ 𝑦𝑦𝑖𝑖 +𝑥𝑥̅ 𝑦𝑦�)

𝜎𝜎𝑥𝑥𝑥𝑥 =
𝑁𝑁
∑ 𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖 −∑ 𝑥𝑥𝑖𝑖 𝑦𝑦�−∑ 𝑦𝑦𝑖𝑖 𝑥𝑥̅ +∑ 𝑥𝑥̅ 𝑦𝑦�

∑ 𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖 −𝑦𝑦� ∑ 𝑥𝑥𝑖𝑖 −𝑥𝑥̅ ∑ 𝑦𝑦𝑖𝑖 +𝑁𝑁𝑥𝑥̅ 𝑦𝑦�

51
1 1 1
𝜎𝜎𝑥𝑥𝑥𝑥 = �∑ 𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖 − 𝑁𝑁 � � 𝑦𝑦� ∑ 𝑥𝑥𝑖𝑖 − 𝑁𝑁 � � 𝑥𝑥̅ ∑ 𝑦𝑦𝑖𝑖 + 𝑁𝑁𝑥𝑥̅ 𝑦𝑦��
∑ 𝑥𝑥𝑖𝑖 ∑ 𝑦𝑦𝑖𝑖 1
𝜎𝜎𝑥𝑥𝑥𝑥 = �∑ 𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖 − 𝑁𝑁𝑦𝑦� − 𝑁𝑁𝑥𝑥̅ + 𝑁𝑁𝑥𝑥̅ 𝑦𝑦��
1
𝜎𝜎𝑥𝑥𝑥𝑥 = (∑ 𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖 − 𝑁𝑁𝑦𝑦�𝑥𝑥̅ − 𝑁𝑁𝑥𝑥̅ 𝑦𝑦� + 𝑁𝑁𝑥𝑥̅ 𝑦𝑦�)
𝑁𝑁
∑ 𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖 −𝑁𝑁𝑦𝑦�𝑥𝑥̅ −𝑁𝑁𝑥𝑥̅ 𝑦𝑦�+𝑁𝑁𝑥𝑥̅ 𝑦𝑦�

∑ 𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖 −𝑁𝑁𝑦𝑦�𝑥𝑥̅

∑ 𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖
𝜎𝜎𝑥𝑥𝑥𝑥 = − 𝑥𝑥̅ 𝑦𝑦� (5.6)
𝑁𝑁
Por lo que la equivalencia 5.5 es correcta. Es más, la ecuación 5.6 presenta una mayor simpleza a la
hora de estimar la covarianza, pues no requiere calcular las diferencias entre las observaciones.
Observación 1: Sin embargo, la distribución de la covarianza representa una desventaja, pues ésta
dependerá de la unidad de medición de las variables. Por ejemplo si multiplico la variable
escolaridad por 1000, ¿Qué valor toma la covarianza?.
Para solucionar este problema necesito considerar lo siguiente:

a. Un estadístico que no dependa de las unidades de medida (que sea a-dimensional).
b. Estandarizado en una escala de fácil uso e intuitiva, de 0 a 1, o de 0% a 100%.
c. Que considere la variabilidad máxima de cada variable para estandarizar (para poder
cumplir con “a” y “b”)
5.2.2. Coeficiente de Correlación
Los problemas de la covarianza para medir asociación pueden ser paliados considerando el
coeficiente de correlación de Pearson. El coeficiente de Correlación de Pearson es una forma de
solucionar a, b, y c. Este se define como (Spiegel, 1976: 82).
σ xy
ρ xy = (5.7)
σ xσ y
Que corresponde al coeficiente de correlación entre x e y, y que se construye a partir de la razón

entre la covarianza y el producto de las desviaciones estándar de las muestras x e y. ¿Qué determina
su signo?
Entonces, el coeficiente de correlación se distribuye de la siguiente forma: −1 ≤ 𝜌𝜌𝑥𝑥𝑥𝑥 ≤ +1.

Además, el coeficiente de correlación puede aproximarse a los siguientes valores dependiendo del
grado de evolución lineal entre las variables.
52
Grafico 5.2: Ejemplos de Correlación.
(a) (b) (c)

ρ xy ≈ +1 ρ xy ≈ −1 ρ xy ≈0
A modo de ejemplo, en nuestro ejercicio anterior 𝜎𝜎𝑥𝑥 = 2.33, 𝜎𝜎𝑦𝑦 = 3.19, y 𝜎𝜎𝑥𝑥𝑥𝑥 = 7.0625, entonces
el coeficiente de correlación entre x e y corresponde a:
σ xy 7.0625
ρ xy = = = 0.95
σ xσ y (2.33)(3.19)
Lo que quiere decir existe un alto grado de evolución entre las variables.
Observación 1: Para observar de qué forma concreta se resuelven a, b, y c, solo resta explicitar los
componentes que conforman el coeficiente de correlación. Esto es, explicitando 5.6:
𝜎𝜎
𝜌𝜌𝑥𝑥𝑥𝑥 = 𝜎𝜎 𝑥𝑥𝑥𝑥
𝜎𝜎
𝑥𝑥 𝑦𝑦
Reemplazado las formulas de la covarianza y la desviación estándar que ya conocemos, se tiene:
∑�𝑥𝑥𝑖𝑖 −𝑥𝑥
��(𝑦𝑦𝑖𝑖 −𝑦𝑦
�)
𝑁𝑁
𝜌𝜌𝑥𝑥𝑥𝑥 =
�)2 ∑(𝑦𝑦𝑖𝑖 −𝑦𝑦
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥 �)2
� �
𝑁𝑁 𝑁𝑁
1
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥�)�𝑦𝑦𝑖𝑖 −𝑦𝑦
��
𝑁𝑁
𝜌𝜌𝑥𝑥𝑥𝑥 = 1 1
� �∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 � �∑(𝑦𝑦𝑖𝑖 −𝑦𝑦�)2
𝑁𝑁 𝑁𝑁
1
��
𝑁𝑁
𝜌𝜌𝑥𝑥𝑥𝑥 = 2
1
�∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 �∑(𝑦𝑦𝑖𝑖 −𝑦𝑦�)2 ��
𝑁𝑁

�� 1 𝑁𝑁
�∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 �∑(𝑦𝑦𝑖𝑖 −𝑦𝑦�)2 𝑁𝑁 1

��
𝜌𝜌𝑥𝑥𝑥𝑥 = (5.8)
�∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 �∑(𝑦𝑦𝑖𝑖 −𝑦𝑦�)2
Ahora, si se supone que 𝑥𝑥𝑖𝑖 = 𝑦𝑦𝑖𝑖 , entonces la expresión 5.8, queda como 5.9, pues al ser idénticas las
variables, la correlación entre ellas será igual a 1.
53
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥�)2
��∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 �
∑(𝑥𝑥 −𝑥𝑥�)2
𝜌𝜌𝑥𝑥𝑥𝑥 = ∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 = 1 (5.9)
𝑖𝑖
Por el contrario, si 𝑥𝑥𝑖𝑖 = −𝑦𝑦𝑖𝑖 , la expresión 5.8 queda como:
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥�)(−𝑥𝑥𝑖𝑖 −(−𝑥𝑥� ))

�∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 �∑(−𝑥𝑥𝑖𝑖 −(−𝑥𝑥� ))2
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥�)(−𝑥𝑥𝑖𝑖 +𝑥𝑥�)

�∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 �∑(−𝑥𝑥𝑖𝑖 +𝑥𝑥�)2
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥�)(𝑥𝑥𝑖𝑖 −𝑥𝑥�)(−1)

�∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 �∑((𝑥𝑥𝑖𝑖 −𝑥𝑥
�)(−1))2
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥�)(𝑥𝑥𝑖𝑖 −𝑥𝑥

�)(−1)
�∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 �∑(𝑥𝑥𝑖𝑖 −𝑥𝑥�)2�(−1)2
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥�)(𝑥𝑥𝑖𝑖 −𝑥𝑥�)(−1)

��∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 � √1
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 (−1)

𝜌𝜌𝑥𝑥𝑥𝑥 = ∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2
= −1 (5.10)
Por lo que el coeficiente de correlación se distribuye de -1 a 1. En este caso consideramos casos

extremos, en los cuales la variable está correlacionada perfectamente en forma directa (𝑥𝑥𝑖𝑖 = 𝑦𝑦𝑖𝑖 ), y
correlacionada perfectamente en forma indirecta (𝑥𝑥𝑖𝑖 = −𝑦𝑦𝑖𝑖 ). La realidad se encuentra entre estos
casos, pues es poco probable que dos variables estén perfectamente correlacionadas. En el extremo,
si no existe ninguna relación entre las variables, el coeficiente de correlación es cero.
Referencias
Spiegel, Murray R. (1976) “Teoría y Problemas de Probabilidad y Estadística”. McGRAW-HILL,

México. S. A. de C. V.
54
Ejercicios Propuestos.
1. Usted ha sido contratado hace dos días en el Departamento de Investigación y Proyección

de un organismo público relacionado a la Salud. En la unidad donde se desempeña, le han
encargado a su equipo obtener alguna medida de asociación entre trastornos músculo-
esqueléticos (TME) y variables de carácter socioeconómico (una medida de desigualdad y
pobreza).
Usted dispone de la siguiente base de datos, donde aparece información para 6 provincias que
corresponden a la población de estudio. Esta es la oportunidad de demostrar la calidad de su
trabajo!!
Tabla 1
Personas Coeficiente de GINI Nº Personas
Provincias Población
con TME (de 0 a 100%) Pobres
A 5 100 65 30
B 4 250 45 26
C 8 270 90 40
D 3 230 20 30
a. Obtenga la co-varianza entre el porcentaje de personas con TME y el coeficiente de GINI

de cada provincia. ¿Por qué se propone usar el porcentaje de personas-TME?
b. Obtenga la co-varianza entre el porcentaje de personas con TME y el porcentaje de

personas pobres de la provincia. ¿Qué variable aparenta estar más relacionada a los casos de
TME?
c. Ahora obtenga el coeficiente de correlación entre las personas con TME y la desigualdad, y
personas con TME y la pobreza. Use las variables debidamente corregidas por población y
use la siguiente información:
Desviación estándar poblacional para el porcentaje de casos TME: 1,46
Desviación estándar poblacional para el porcentaje de casos pobres: 7,63
Desviación estándar poblacional para la desigualdad: 25,74.
d. ¿Es consistente el resultado de 3) con los resultados de 1) y 2)? ¿Qué puede decir con
respecto a esto? ¿En qué medida confía más?
e. Diga algo respecto a las desviaciones estándar expuestas en 3), transfórmelas a varianza, y
luego grafique considerando en el eje de abscisas la primera y en el eje de ordenadas la
segunda. ¿A qué función corresponde la relación expuesta?
55
2. En los siguientes gráficos de dispersión señale de qué signo debería ser la covarianza y el
coeficiente de correlación.
(a) (b) (c) (d)
Hasta el momento solo se ha visto correlación, y no hemos incursionado en la causalidad. No

obstante, si quisiéramos señalar que existe causalidad, debemos plantear las relaciones de la
siguiente forma: y=f(x), es decir, y es una función de x.
Ayudándose de su intuición, plantee una ecuación hipotética para las relaciones entre las variables x
e y en los gráficos del (a) al (d).
56
5.3. Otros estadísticos de asociación.
Como ya hemos visto, en el análisis empírico es frecuente tener fenómenos en los cuales se da la
interrelación entre dos o más variables, para lo cual es útil usar el análisis gráfico desde el punto de
vista intuitivo, y estadísticos de asociación desde el punto de vista formal. La medida básica dentro
de los estadísticos formales es la covarianza, sin embargo, dado que ésta no entrega un valor
estandarizado de correlación, se suele utilizar el coeficiente de correlación de Pearson.
Sin embargo, también existen otros coeficientes de correlaciones, como el de Spearman, cuya
fórmula y características pasamos a revisar a continuación.
5.3.1. Coeficiente de correlación de Spearman
Si bien el coeficiente de correlación de Pearson es bastante útil y corresponde a uno de los más
utilizados para medir asociación lineal, existen ciertos casos en los cuales estamos interesados en
medir la relación entre el ranking de las variables más que la relación entre sus niveles. Esto se
puede dar debido a la naturaleza de las variables, que pueden corresponder a variables ordinales, o
porque estamos interesados en obtener una medida más conservadora de correlación, inmune a
datos extremos y muy alejados de la muestra.
Para estos casos, se usa el coeficiente de correlación de Spearman (Levin y Levin, 1999), cuya
estimación se realiza de la siguiente forma:
6∑i =1 ( R y − R x ) 2
n
r = 1−
s
(5.10)
n(n 2 − 1)
xy
Donde (𝑅𝑅𝑦𝑦 − 𝑅𝑅𝑥𝑥 ) corresponde a la diferencia entre el ranking de la variable y y la variable x. El

ranking se diseña de la siguiente forma: la variable de mayor (menor) valor en y tiene ranking=1, la
segunda de mayor (menor) valor tiene ranking=2, y así sucesivamente. Ej.: muestra A, ranking entre
paréntesis: 1(4), 2(3), 3(2), 4(1).
Considere los datos de la Tabla 5.3 (Levin & Levin, 1999: 217) donde las personas se encuentran
ordenadas por rango, donde Miguel tiene el más alto estatus socioeconómico y Araceli el mayor
tiempo viendo TV.
Tabla 5.3. Cálculo del Coeficiente de Correlación de Spearman

Entrevistado Estatus Tiempo empleado ( Ry − Rx ) ( R y − Rx ) 2
Socioeco. (R x ) en ver la TV (R y )
Miguel 1 2 1 1
Araceli 2 1 -1 1
Juan 3 3 0 0
Norma 4 5 1 1
María 5 4 -1 1
Tomás 6 8 2 4
Rafael 7 6 -1 1
Alejandra 8 7 -1 1
∑
n
( R y − Rx ) 2 10
i =1
De acuerdo a los cálculos de la Tabla 1, el coeficiente de correlación de Spearman es igual a:
57
6∑i =1 ( R y − R x ) 2
n
6(10) 60 60
r = 1−
s
= 1− = 1− = 1− = 1 − 0.1190 = 0.881
n(n − 1) 8(8 − 1) 8(64 − 1)
xy 2 2
504
Su interpretación es idéntica a la del coeficiente de correlación de Pearson, por lo que se tiene un

alto grado de correlación entre los datos. La literatura señala que este coeficiente es menos sensible
a los datos extremos que el coeficiente de Pearson ¿Por qué?.
Observación 1: A menudo llama la atención la fórmula del coeficiente de correlación de Spearman,

sin embargo, dicha fórmula nace de la misma fórmula del Pearson. A continuación se deriva el
coeficiente de Spearman siguiendo la metodología de Sarabia y Pascual (2005). Consideremos la
formula 5.7:

��
𝜌𝜌𝑥𝑥𝑥𝑥 = (5.7)
Dado que se está trabajando exclusivamente con rankings, y por ende, ordenamientos de números
con un espacio uniforme entre ellos, se puede obtener la media de estos, la que corresponde a:
1 1 1 𝑛𝑛(𝑛𝑛+1) 𝑛𝑛+1
𝑥𝑥̅ = 𝑦𝑦� = ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 = ∑𝑛𝑛𝑖𝑖=1 𝑖𝑖 = 𝑛𝑛 2
= 2
(5.11)
𝑛𝑛 𝑛𝑛
Donde se utiliza el hecho de que la sumatoria de cualquier serie de 1 a n es igual a n(n+1)/2. Por
ejemplo, la suma de 1 a 3 es 1+2+3=6. Con la fórmula es 3(3+1)/2=6. Por otro lado, sabemos que
las diferencias respecto de la media al cuadrado se pueden expresar de la siguiente forma:
∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )2 = ∑ 𝑥𝑥𝑖𝑖2 − 𝑛𝑛𝑥𝑥̅ 2 (5.12)
Y reemplazando en la última expresión algunas de las identidades de la ecuación 5.11, se obtiene

que:
𝑛𝑛+1 2
∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )2 = ∑ 𝑥𝑥𝑖𝑖2 − 𝑛𝑛𝑥𝑥̅ 2 = ∑ 𝑖𝑖 2 − 𝑛𝑛 � � (5.13)
2
En este punto, se puede utilizar otra identidad de las sumatorias, la que consiste en que ∑𝑛𝑛𝑖𝑖=1 𝑖𝑖 2 =
𝑛𝑛(𝑛𝑛+1)(2𝑛𝑛+1)
6
. Reemplazando en 5.13 se tiene:
𝑛𝑛(𝑛𝑛+1)(2𝑛𝑛+1) 𝑛𝑛(𝑛𝑛+1)2
∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )2 = −
6 4
𝑛𝑛(𝑛𝑛+1)(2𝑛𝑛+1) 𝑛𝑛(𝑛𝑛2 +2𝑛𝑛+1)
= 6
−
4
𝑛𝑛(𝑛𝑛+1)(2𝑛𝑛+1) (𝑛𝑛3 +2𝑛𝑛2 +𝑛𝑛)
= 6
−
4
2(2𝑛𝑛3 +3𝑛𝑛2 +𝑛𝑛) 3(𝑛𝑛3 +2𝑛𝑛2 +𝑛𝑛)
= −
12 12
4𝑛𝑛3 +6𝑛𝑛2 +2𝑛𝑛−3𝑛𝑛3 −6𝑛𝑛2 −3𝑛𝑛
=
12
𝑛𝑛3 −𝑛𝑛
= (5.14)
12
Finalmente, la suma de los cuadrados de las diferencias entre rankings es:
∑ 𝑑𝑑𝑖𝑖2 = ∑(𝑥𝑥𝑖𝑖 − 𝑦𝑦𝑖𝑖 )2 = ∑[(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ) − (𝑦𝑦𝑖𝑖 − 𝑦𝑦�)]2
58
= ∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )2 + ∑(𝑦𝑦𝑖𝑖 − 𝑦𝑦�)2 − 2 ∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 − 𝑦𝑦�) (5.15)
A continuación se despeja el último miembro del lado derecho de la ecuación 5.15, pues de esta
forma se obtiene el numerador del coeficiente de Pearson:
∑ 𝑑𝑑𝑖𝑖2 = ∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )2 + ∑(𝑦𝑦𝑖𝑖 − 𝑦𝑦�)2 − 2 ∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 − 𝑦𝑦�)
1
∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 − 𝑦𝑦�) = (∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )2 + ∑(𝑦𝑦𝑖𝑖 − 𝑦𝑦�)2 − ∑ 𝑑𝑑𝑖𝑖2 )
2
1 𝑛𝑛3 −𝑛𝑛 𝑛𝑛3 −𝑛𝑛 𝑛𝑛3 −𝑛𝑛 1

∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 − 𝑦𝑦�) = � + − ∑ 𝑑𝑑𝑖𝑖2 � = − ∑ 𝑑𝑑𝑖𝑖2 (5.16)
2 12 12 12 2
Ahora, reemplazando todas las expresiones en la fórmula del coeficiente de Pearson, se tiene la
ecuación 5.17:

��
𝑛𝑛3 −𝑛𝑛 1
− ∑ 𝑑𝑑𝑖𝑖2
𝑟𝑟𝑥𝑥𝑥𝑥 = 12 2
(5.17)
𝑛𝑛3 −𝑛𝑛 𝑛𝑛3 −𝑛𝑛
� 𝑥𝑥
12 12
Y el coeficiente de correlación de Spearman es:
− ∑ 𝑑𝑑𝑖𝑖2 12 1
𝑟𝑟𝑥𝑥𝑥𝑥 = 12 2
𝑛𝑛3 −𝑛𝑛
=1− ∑ 𝑑𝑑𝑖𝑖2
12
6 ∑ 𝑑𝑑 2
𝑟𝑟𝑥𝑥𝑥𝑥 = 1 − 𝑛𝑛(𝑛𝑛2 −1)
𝑖𝑖
5.3.2. Aplicaciones con medidas de asociación.
Otro elemento de importancia en el análisis de datos dice relación con la matriz de correlación. Esta
matriz nos ofrece información cuando se está analizando la correlación entre una serie de variables
antes de realizar un análisis de tipo explicativo.
En la Tabla 1 se tiene una matriz de correlaciones de 3x3 en la cual se tienen los coeficientes de
correlación de Pearson. ¿Por qué hay espacios en blanco en dicha matriz?
Tabla 5.4. Matriz de correlaciones

x1 x2 x3
x1 ρx x
1 1
x2 ρx x
2 1
ρx 2 x2
x3 ρx x
3 1
ρx x 3 2
ρx x 3 3
Donde ρ x1 x1 = ρ x 2 x 2 = ρ x3 x3 =1.
59
Referencias.
Sarabia Alegría, José María; Pascual Sáez, Marta (2005). “Curso básico de estadística para
economía y administración de empresas”. Textos Universitarios, n° 2, Ciencias Sociales,
Universidad de Cantabria.
60
1. Demuestre que la covarianza es igual a la expresión (1):

∑
n
x yi
s xy = i =1 i
− xy (1)
n
¿Qué método le resulta más eficiente para estimar la covarianza?
2. Suponga que tiene los siguientes datos para estimar el coeficiente de correlación de
Spearman. Organice los datos por Ranking y luego realice los cálculos necesarios.
Tabla 1. Datos
X y
18 15
17 18
15 12
12 16
10 6
9 10
8 8
8 7
5 5
1 2
3. ¿Cuál es la diferencia entre la co-varianza y el coeficiente de correlación? Expréselo

formalmente señalando la intuición detrás de las expresiones. ¿Qué determina el signo del
coeficiente de correlación?
4. Ahora estime el coeficiente de correlación de Pearson para los mismos datos de la Tabla 1.
¿Existe alguna relación entre los coeficientes? ¿Cuál es más elevado y por qué?
5. Estime la matriz de correlaciones para los siguientes datos. ¿Cuáles corresponden a las
variables menos correlacionadas?
Tabla 2. Datos
X Y Z
1 2.33 6
2 4 5
3 5 1
61
6. Elementos de Inferencia Estadística
6.1. El porqué del uso de muestras.
En primer lugar es necesario comprender que se entiende por inferencia estadística. En los capítulos
anteriores se revisaron los fundamentos de la estadística descriptiva, es decir, todos aquellos
estadísticos que nos permiten extraer información de una agrupación de datos, referentes a su
posición, su dispersión, y otras características particulares. Asimismo, se revisaron estadísticos
referentes a la asociación del comportamiento de dos variables.
Sin embargo, en dichas ocasiones se asumió que los datos con los que contábamos correspondían a
una población. Ese es un supuesto simplificador, pues en la realidad no necesariamente los datos
con los que contamos corresponden a datos representativos del fenómeno que queremos estudiar,
debido a diferentes restricciones.
Estas restricciones, como la disponibilidad de los datos, el tiempo del investigador, sus recursos,
conllevan a la elección de muestras. En este contexto, es de interés determinar si los datos que
tenemos, y por ende sus estadísticos, permiten hacer inferencia respecto de los datos de la
población. Las secciones siguientes se basan en Levin y Levin (1999).
6.2. Métodos de Muestreo.
Siguiendo a Levin y Levin (1999), los métodos de muestreo se pueden dividir en muestreo no
aleatorio y muestreo aleatorio. De acuerdo a los autores, para el caso de los métodos de muestreo no
aleatorio se encuentra el muestreo por accidente y el muestreo por cuota. El primero implica que el
investigador no tiene ninguna restricción en la elección de la muestra, salvo la conveniencia,
mientras que el segundo implica que ciertas características de la población se encuentren
representadas en la muestra. Por ejemplo, si en una población de 1000 personas hay 600 mujeres y
400 hombres, y quiero que una muestra de 100 personas (n) conserve el mismo nivel de
representatividad desde el punto de vista del sexo, debo escoger a 60 mujeres y 40 hombres.
El muestreo aleatorio, por el contrario, implica que cada elemento de una población tiene la misma
probabilidad de aparecer en la muestra, y entre estos se tiene el muestro aleatorio simple, el
muestreo sistemático, y el muestreo estratificado. Suponiendo que se tiene una lista con toda la
población de N personas, el muestreo aleatorio simple implica que la elección aleatoria de una
muestra n de la población no sigue ningún patrón predeterminado, por el contrario, surge del azar,
para lo que es útil generar números aleatorios, los que pueden servir para llevar a cabo la selección.
El muestreo sistemático consiste en seleccionar una iésima persona de la población en forma

iterativa hasta completar el n deseado (Webster, 2000). Por ejemplo, si se define i=3, y se ordenan
los datos de forma aleatoria, se debe definir la primera observación de la muestra, que debe estar
entre 1 y 3. Si se elige 2 por ejemplo, la elección implica elegir los elementos [2, 2+(i), 2+2(i),
2+3(i)]. Entonces, se eligen los elementos que aparecen en negrita en la siguiente lista de números,
pues tienen las posiciones 2, 5, 8 y 11.
6, 5, 7, 8, 9, 4, 6, 5, 8, 4, 6.
Por último, el muestreo estratificado implica el subdividir la población en estratos, dependiendo de

cuáles son las variables que considere relevante. Por ejemplo, se puede subdividir la población en
tramos de ingreso y color político, y luego aplicar muestreo aleatorio sobre cada tramo definido.
62
6.3. Error de muestreo.
En la práctica es frecuente que en la muestra que tenemos exista error de muestreo. Esto es, si por
ejemplo se tiene una muestra N, que tiene una media poblacional µ, y si obtenemos tres muestras
de la población, n 1 , n 2 , y n 3 , cada una con sus propias medias, 𝑥𝑥̅1 , 𝑥𝑥̅2 , y 𝑥𝑥̅3 , no es extraño que
dichas medias no coincidan del todo con la media poblacional, µ. Esto se da, pues si bien se elige
una muestra aleatoria, siempre está la posibilidad de que nuestros datos provengan de un sector
particular o sesgado de la población. En forma adicional, así como cada muestra tiene su propia
media, cada una de estas también tienen asociada su propia desviación estándar, por lo que al
diferenciar, tenemos la media y la desviación estándar poblacional, µ y σ, respectivamente, y la
media y la desviación estándar de la muestra, 𝑥𝑥̅ y s, respectivamente.
Sin embargo, existe un modelo teórico que nos permite relacionar las medias muestrales con la
población. Por ejemplo, si se saca el mayor número posible de muestras del mismo tamaño de una
población, digamos n 1 , n 2 ,…,n z , luego se obtiene el promedio de cada muestra, es decir, 𝑥𝑥̅1 , 𝑥𝑥̅2 , …
,𝑥𝑥̅𝑧𝑧 , y después se construye una distribución a partir de las medias estimadas, se obtiene lo que se
conoce como distribución muestral de medias. Esta distribución tiene las siguientes propiedades
(Levin & Levin, 1999: 102):
i. La distribución muestral de medias se aproxima a una curva normal,

ii. La media de una distribución muestral de medias es igual a la verdadera media de la
población,
iii. La desviación estándar de una distribución muestral de medias es menor que la desviación
estándar de la población (¿Por qué?).
6.4. Distribución normal en la inferencia.
Conociendo las propiedades de la distribución muestral de medias, podemos acudir a la distribución

normal, y usar sus propiedades para la inferencia. En este sentido, de la sección de “Distribución
Normal” sabemos que ésta tiene áreas de acumulación de probabilidades, y también tenemos
información respecto de algunos intervalos de acumulación. En el Gráfico 6.1 se observan las áreas
que comprende cada sección de desviaciones respecto a la media, en unidades de desviación
estándar.
Gráfico 6.1. Distribución normal y el área acumulada bajo la curva.

Densidad
-3 -2 -1 x 1 2 3
Fuente: Elaboración propia usando el Software STATA.
63
El valor particular de probabilidad acumulada puede encontrarse en una tabla de porcentaje
acumulado bajo la curva normal. En la curva normal, si queremos hacer un análisis al 90% de
confianza, el valor -1,645;+1,645 en el eje de las abscisas acumula el 90% de la probabilidad. El
análisis es análogo para los niveles de confianza de 95% (-1,96; +1.96), y 99% (-2.58; +2.58).
Llamaremos a esos números que denotan los intervalos, z.
6.5. Error estándar de la media.
Dado que en la realidad es difícil contar con muestras, y por ende, tener precisión en los datos que
estimamos, es útil acudir a una medida de error. Para esto, se tiene el error estándar de la media
(esm), que corresponde a una estimación de la desviación estándar de la distribución muestral de
medias. Dicho estadístico se estima como:
s
sX = (6.1)
n −1
Donde s corresponde a la desviación estándar de la muestra y el n el número de valores de una

muestra. Esta fórmula indica que a medida que aumenta n, disminuye el esm. Por el contrario, si
tengo una muestra con dos observaciones, s es igual al esm. Este estadístico provee información
importante para estimar la media poblacional, a través del intervalo de confianza, el que se estima
de la forma:
X ± z ×σ X (6.2)
Por ejemplo, si el ingreso promedio de una muestra de 10 personas es de 2.7 y su desviación

estándar corresponde a 1.27, un intervalo de confianza al 95% sería igual a:
𝑋𝑋� ± 𝑧𝑧𝜎𝜎𝑥𝑥̅
1.27
2.7 ± (1.96) 10−1
√
2.7 ± (1.96)0.42
(1.8768; 3.5232 ) (6.3)
Por lo que con un 95% de confianza, la verdadera media poblacional se encuentra entre 1.88 y 3.52.
6.6. Estimación de proporciones.
De la misma forma en la que es posible estimar una media poblacional, también es posible estimar
proporciones.
𝑃𝑃(1−𝑃𝑃)
𝜎𝜎𝑝𝑝 = � 𝑁𝑁
(6.4)
Donde 𝜎𝜎𝑝𝑝 corresponde al error estándar de la proporción, P es la proporción muestral, y N es el

número de observaciones de la muestra.
64
Siguiendo a Levin y Levin (1999: 114), si el 45% de una muestra aleatoria de 100 personas informa
que estas están a favor de la legalización de la droga, y se busca un intervalo de confianza al 95%,
la estimación sería:
𝑃𝑃 ± 𝑧𝑧𝜎𝜎𝑝𝑝
0.45(1−0.45)
0.45 ± (1.96)� 100
0.45 ± (1.96)0.05
(0.352; 0.548) (6.5)
Por lo que con un 95% de confianza, la proporción poblacional se encuentra entre 0.35 y 0.55.
Referencias
Levin, Jack y Levin, William C. (1999). “Fundamentos de Estadística en la Investigación Social”.

Webster, Allen (2000). “Estadística aplicada a los negocios y la economía”. Tercera Edición.
McGraw-Hill Interamericana, S.A. Santa Fe de Bogotá, Colombia.
65
1. Suponga que tiene una muestra de 1000 personas, cuya frecuencia promedio de uso de
bicicleta por día es igual a 2.3. La desviación estándar de la muestra es de 0.8. Estime un
intervalo de confianza al 95%.
2. Dispone de la siguiente base de datos, estime un intervalo de confianza al 90%:

5, 6, 7, 4, 4, 5, 7, 8, 9, 11
3. Suponga que tiene la siguiente población. Obtenga una muestra aleatoria del 60% de la
población, obtenga la media muestral, y compárela con la media poblacional. Obtenga
luego una muestra estratificada para zona urbana y rural, del 60%. Obtenga las medias y
compárelas con la población.
Tabla 1
Zona Pobreza por Zona
Urbana 0.3
Urbana 0.2
Urbana 0.23
Urbana 0.17
Rural 0.2
Rural 0.3
Rural 0.3
Rural 0.4
Rural 0.5
66
7. Test de Hipótesis.
7.1. Test estadísticos relevantes
Dado que no poseemos la población en la mayoría de los casos, suele ser útil usar inferencia para
testear la validez de ciertas hipótesis que se establecen respecto de los datos. El proceso de
inferencia estadística conlleva el establecimiento de una hipótesis nula (H 0 ), una hipótesis
alternativa (H 1 ), el planteamiento de un estadístico, y un criterio de rechazo/aceptación. A
continuación revisaremos algunos test estadísticos que se usan en forma usual para analizar la
diferencia de medias o de frecuencias relativas. Esta sección se basa íntegramente en Levin y Levin
(1999).
7.2. Test de Diferencia de Medias
Este corresponde a una prueba en la cual se testea si dos medias muestrales difieren
significativamente. Suponga que saca n pares de muestras de una población normal y calcula la
diferencia de los promedios, por ejemplo, el ingreso entre hombres y mujeres. Estas diferencias
también se distribuyen normal, y el conjunto de todas ellas da origen a la Distribución Muestral de
Diferencias de Medias (se vería como el gráfico 7.1). La media de dicha distribución corresponderá
a cero, si se avanza hacia la derecha dicha diferencia será positiva, mientras que a la izquierda será
negativa.
Gráfico 7.1. Distribución Muestral de Diferencias.

Densidad
-3 -2 -1 x 1 2 3
Fuente: Elaboración propia usando el Software STATA.
En este caso, el estadístico del test sería la diferencia de medias (𝑥𝑥̅1 − 𝑥𝑥̅2 ) corregida por la
desviación estándar de la Distribución Muestral de Diferencias (σ DIF ). Dicho estadístico se definirá
como Z. El valor que tome este estadístico será vital para determinar si las medias son similares o
difieren. La intuición indica que un Z cerca de cero (media de la Distribución) corresponderá a una
situación en la cual las medias son bastantes similares, mientras que un Z alejado de cero, tanto a la
derecha como a la izquierda, implica una diferencia importante de las medias. En términos
estadísticos, el valor de Z definirá una probabilidad acumulada en la distribución, y dicha
probabilidad determinará si la diferencia de medias se debe simplemente a error muestral, o a que
efectivamente existe una diferencia entre ellas.
El proceso de implementación se detalla a continuación:
a) Planteamiento de hipótesis:
67
H 0 : µ1 = µ 2
H 1 : µ1 ≠ µ 2
La hipótesis nula (H 0 ) supone que cualquier diferencia entre las medias solo es producto del error
de muestreo.
b) Planteamiento del estadístico:
(𝑥𝑥̅1 −𝑥𝑥̅ 2 )−(𝜇𝜇1 −𝜇𝜇2 )

𝑍𝑍 = 𝜎𝜎𝐷𝐷𝐷𝐷𝐷𝐷
(7.1)
Donde σ DIF corresponde a la desviación estándar de la Distribución Muestral de Diferencias. Un

estimador de este estadístico corresponde a:
𝜎𝜎𝐷𝐷𝐷𝐷𝐷𝐷 = �𝜎𝜎𝑥𝑥̅21 + 𝜎𝜎𝑥𝑥̅22 (7.2)
Donde:
𝑠𝑠𝑥𝑥�1
𝜎𝜎𝑥𝑥̅1 = (7.3)
�𝑛𝑛1 −1
c) Obtención de la probabilidad: se supone que la Distribución de Diferencia de Medias tiene

una distribución normal, entonces de debe obtener la probabilidad acumulada a la altura del
Z obtenido, y luego calcular la probabilidad para rechazar o no rechazar la hipótesis nula.
P A =P A (Z)
P = (1- P A )*2 (7.4)
Donde P corresponde a la probabilidad de que la diferencia de medias se dé en base a error

muestral.
d) Regla de decisión: se rechaza la hipótesis nula si la probabilidad de que la diferencia de

medias se dé por error muestral (P) es inferior a 10%, 5%, o 1%.
Ejemplo: Se tienen los siguientes datos, 𝑥𝑥̅1 = 7, 𝑥𝑥̅2 = 2, σ DIF = 2. Implemente un test de diferencia
de medias (Levin y Levin, 1999: 129).
H 0 : µ1 = µ 2
H 1 : µ1 ≠ µ 2
b) Planteamiento del estadístico:
(𝑥𝑥̅1 −𝑥𝑥̅ 2 )−(𝜇𝜇1 −𝜇𝜇2 )

𝑍𝑍 =
𝜎𝜎𝐷𝐷𝐷𝐷𝐷𝐷
68
Dado que la hipótesis nula señala que 𝜇𝜇1 = 𝜇𝜇2 , entonces 𝜇𝜇1 − 𝜇𝜇2 = 0, por lo que se reemplaza
dicha expresión en el estadístico en conjunto con los valores dados en el enunciado
7−2
𝑍𝑍 = = 2.5
2
c) Obtención de la probabilidad: al buscar en la tabla de la distribución normal, se tiene que la

probabilidad acumulada en el percentil Z=2,5, es de 0.9938, entonces P A =0.9938, y
reemplazando:
P = (1- P A )*2
P = (1- 0.9938)*2
P = 0.0124 ≈ 1.24%
Entonces, la probabilidad de que la diferencia de medias de 5 entre dos medias ocurra en base al
error muestral, es de 1.24%, por lo que se rechaza hipótesis nula al 5% de significancia.
7.2.1. Test de Diferencia de Medias: muestras pequeñas
Para el caso de muestras grandes, como se acude al teorema del límite central, se supone que la
variable aleatoria se distribuye normal. Sin embargo, al usar un número reducido de datos (<30
datos), se debe usar la distribución t-student. Dado que a medida que se reduce el tamaño de la
muestra se tiene menos libertad para inferir cosas respecto de la población, dicha distribución
internaliza este aspecto a través de los grados de libertad (gl). Entonces, a medida que disminuye el
tamaño muestral, disminuyen los grados de libertad; a medida que aumenta el tamaño muestral,
aumentan los grados de libertad; en el extremo, si el tamaño muestral fuera muy grande, este
estadístico tendería al Z de la distribución normal. El estadístico corresponde a la ecuación 7.5.
(𝑥𝑥̅1 −𝑥𝑥̅ 2 ) ∗
𝑡𝑡 = 𝜎𝜎𝐷𝐷𝐷𝐷𝐷𝐷
~𝑡𝑡(𝑛𝑛 1 +𝑛𝑛2 −2)
𝑥𝑥% (7.5)
Donde (𝑛𝑛1 + 𝑛𝑛2 − 2) corresponde a los grados de libertad, 𝑛𝑛1 y 𝑛𝑛2 corresponden a los tamaños
muestrales, y x% al nivel de significancia al cual se puede realizar el análisis. En este caso se
rechaza la hipótesis nula si el t calculado es mayor al t teórico, es decir, 𝑡𝑡 𝑐𝑐 > 𝑡𝑡 ∗ .
7.2.2. Test de Diferencia de Medias: tamaños muestrales distintos.
Para el caso en el cual los tamaños muestrales son distintos se hace necesario corregir la desviación
estándar (𝜎𝜎𝐷𝐷𝐷𝐷𝐷𝐷 ) de la Distribución de Diferencia de Medias. En este sentido, el análisis es similar a
los casos anteriores de diferencias de medias, pero se debe obtener 𝜎𝜎𝐷𝐷𝐷𝐷𝐷𝐷 como:
𝑁𝑁 𝑠𝑠2 +𝑁𝑁2 𝑠𝑠22 1 1

𝜎𝜎𝐷𝐷𝐷𝐷𝐷𝐷 = �� 𝑁𝑁1 +𝑁𝑁
1
�� + � (7.6)
1 2 −2 𝑁𝑁1 𝑁𝑁2
Donde 𝑠𝑠1 y 𝑠𝑠2 son las desviaciones estándar de la primera y segunda muestra respectivamente, y 𝑁𝑁1
y 𝑁𝑁2 , son los tamaños muestrales de las muestras, respectivamente.
69
7.3. Test Chi cuadrado
Este test corresponde a un test de hipótesis para pruebas no paramétricas, en las cuales no se está
estimando la diferencia de parámetros, por el contrario, se analiza la similitud entre frecuencias de 2
o más categorías (Levin y Levin, 1999: 170).
Su proceso de implementación es el siguiente:
H 0 : frecuencia de una variable x es igual para las categorías A y B.

H 1 : frecuencia de una variable x es desigual para las categorías A y B.
b) El estadístico corresponde a:
(𝑓𝑓0 −𝑓𝑓𝑒𝑒 )2
𝑥𝑥𝑐𝑐2 = ∑ � � ~𝑥𝑥∗2 (𝑓𝑓−1)(𝑐𝑐−1) (𝑥𝑥%) (7.7)
𝑓𝑓𝑒𝑒
Donde el estadístico se distribuye con (f-1)x(c-1) grados de libertad (gl), y f o corresponde a la

frecuencia real, mientras que f e corresponde a la esperada. Cabe destacar que en los grados de
libertad, f y c corresponden a las filas y columnas de la matriz de frecuencias que se tenga. En el
ejemplo de la sección esto va a quedar más claro.
c) Regla de decisión: se rechaza la hipótesis nula si c c2 > χ *

2
Ejemplo: Suponga que tiene los siguientes datos respecto a los métodos de crianza de los niños,
separados por la orientación política de los padres (Levin y Levin, 1999:171). La información se
observa en la Tabla 7.1, en el cual se denotan los diferentes espacios usando la notación matricial
“fila, columna”. Por ejemplo, para referirse al número de liberales que emplean métodos no rígidos
nos referimos al 11 (fila 1, columna 1), mientras que para referirse a los conservadores que
emplean métodos no rígidos, nos referimos al 12 (fila 1, columna 2). En este sentido, las
dimensiones de la matriz corresponden a 2x2, pues existen dos filas y dos columnas.
Tabla 7.1. Métodos de crianza por categoría liberal o conservadora

Métodos Liberales Conservadores
11 12
No rígidos 5 10
21 22
Rígidos 15 10
Luego es necesario calcular las frecuencias esperadas que se obtienen como el producto entre los
totales marginales respectivos y la división por el total de observaciones. Los totales marginales
corresponden a las sumas totales de cada fila y columna. Por ejemplo, para el espacio de la primera
fila y primera columna (11), la frecuencia real es 5, sin embargo la frecuencia esperada es:
f e = (total marginal fila “i”) x (total marginal columna “j”) / N (7.8)

f e = (total marginal fila 1) x (total marginal columna 1) /40
f e = (15) x (20) /40 = 7.5
Tal como se observa en la Tabla 7.2. Este proceso se repite para todas los espacios de la matriz de
2x2.
70
Tabla 7.2. Métodos de crianza por categoría liberal o conservadora
Métodos Liberales Conservadores Total marginal
11 12
No rígidos 5 (7.5) 10 (7.5) 15
21 22
Rígidos 15 (12.5) 10 (12.5) 25
Total marginal 20 20 Total=40
Luego, una vez que se obtienen todas las frecuencias esperadas, es necesario calcular el estadístico
y los grados de libertad.
(5−7.5)2 (10−7.5)2 (15−12.5)2 (10−12.5)2

𝑥𝑥𝑐𝑐2 = + + +
7.5 7.5 12.5 12.5
𝑥𝑥𝑐𝑐2 = 0.83 + 0.83 + 0.5 + 0.5 => 𝑥𝑥𝑐𝑐2 = 2.66
gl= (f-1) x (c-1)

gl= (2-1) x (2-1)
gl= (1) x (1) = 1, y al 5%
𝑥𝑥∗2 = 3.841
Entonces, si el estadístico (𝑥𝑥𝑐𝑐2 ) es mayor que el valor teórico (𝑥𝑥∗2 ) se rechaza la hipótesis nula. En
este caso, dado que 𝑥𝑥𝑐𝑐2 < 𝑥𝑥∗2 , “se acepta” la hipótesis nula.
Referencias

71
1. Suponga que tiene los siguientes datos: 𝑥𝑥̅1 = 1.71; 𝑥𝑥̅2 = 1.54; s 1 =1.07; s 2 = 0.94, n 1 =35
n 2 =35. Realice un test de diferencia de medias (Levin y Levin, 1999).
2. Tiene la siguiente tabla respecto al consumo de marihuana en universitarios y no

universitarios. Realice un test al 5% de significancia (Levin y Levin, 1999).
Tabla 2
Universitario No Universitario
Fumador 15 5
No fumador 6 10
3. Realice un test de diferencia de medias a partir de la siguiente información: 𝑥𝑥̅1 = 1.33;

𝑥𝑥̅2 = 4.5; s 1 =0,48; s 2 = 0,76, n 1 = n 2 =6, al 5% de significancia (Levin y Levin, 1999).
4. Realice un test al 5% de significancia (Levin y Levin, 1999):
Tabla 3
A B C
X 7 9 14
Y 10 10 8
Z 15 11 5
72
8. La Programación Lineal.
Durante la Segunda Guerra Mundial un equipo de científicos en Inglaterra comenzó a preguntarse

de qué formas era posible usar el material bélico de modo de maximizar la eficiencia y la
productividad (Taha, 2012). Dicha investigación dio origen a un área que se conoció como
Investigación de Operaciones (IO), y que abarca diferentes técnicas tales como la Programación
Lineal, el Modelo de Transporte, el Modelo de Redes, Programación Dinámica, así como algunas
que son comunes a la estadística y a la econometría, entre otras. Esta disciplina corresponde a una
parte esencial en las carreras de ingeniería y administración en la actualidad, toda vez que permite
incrementar la eficiencia de actividades productivas y ofrecer un instrumental analítico para
solución de problemas que impliquen la gestión de recursos.
La técnica que esta sección describe corresponde a la Programación Lineal (PL), y consiste en una
herramienta de optimización en la cual se plantea una función objetivo sujeta a una o más
restricciones, con el objeto de obtener los valores que maximizan o minimizan la función objetivo
(Peñafiel, 1976: 13). Dicha función puede corresponder a una función de beneficios o costos, y
como es imposible llevar los beneficios a infinito, así como llevar los costos a cero, es que se
plantea un problema de optimización. La característica de este problema de optimización es que las
ecuaciones implicadas tienen formas lineales, por lo que es un caso de optimización menos general
que el caso de los Método de los Multiplicadores de Lagrange de la sección “Aplicaciones de la
Derivada”.
8.1. Problema de Programación Lineal.
Desde el punto formal, un problema de PL consiste en una función objetivo lineal (8.1) sujeta a una
serie de restricciones (8.2) (Peñafiel, 1976: 18). Tanto la función objetivo como las restricciones se
encuentran en función de variables, 𝑥𝑥1 , 𝑥𝑥2 , … , 𝑥𝑥𝑛𝑛 , por lo que hallar los valores de las variables que
optimizan el problema es el objetivo subyacente de la PL.
𝑧𝑧 = 𝑐𝑐1 𝑥𝑥1 + 𝑐𝑐2 𝑥𝑥2 + ⋯ + 𝑐𝑐𝑛𝑛 𝑥𝑥𝑛𝑛 (8.1)
s.a.:
𝑎𝑎11 𝑥𝑥1 + 𝑎𝑎12 𝑥𝑥2 + ⋯ + 𝑎𝑎1𝑛𝑛 𝑥𝑥𝑛𝑛 ≤ (≥)𝑏𝑏1

𝑎𝑎21 𝑥𝑥1 + 𝑎𝑎22 𝑥𝑥2 + ⋯ + 𝑎𝑎2𝑛𝑛 𝑥𝑥𝑛𝑛 ≤ (≥)𝑏𝑏2
⋮
𝑎𝑎𝑚𝑚1 𝑥𝑥1 + 𝑎𝑎𝑚𝑚2 𝑥𝑥2 + ⋯ + 𝑎𝑎𝑚𝑚𝑚𝑚 𝑥𝑥𝑛𝑛 ≤ (≥)𝑏𝑏𝑚𝑚 (8.2)
Donde 𝑥𝑥𝑗𝑗 ≥ 0 para 𝑗𝑗 = 1,2, … , 𝑛𝑛.
Dependiendo del problema específico, la solución del modelo de PL se puede obtener de diferentes
formas, ocupando el Método Simplex o simplemente aplicando el método gráfico.
8.2. Solución con Método Gráfico.
A continuación se expone un ejemplo de resolución de PL con dos variables.
Ejemplo 1: Existe una empresa que produce pinturas para exterior (𝑋𝑋1 ) y para interior (𝑋𝑋2 ),
utilizando dos materias primas, M1 y M2. En la Tabla 8.1 se observa la materia prima que necesita
73
la empresa para producir ambos tipos de pintura, en conjunto con la disponibilidad máxima de
dichas materias primas, y la utilidad que la empresa obtiene al vender cada tonelada de su producto
(Taha, 2012: 13, Ejemplo 2.1-1).
Tabla 8.1. Materias primas por producto,

Disponibilidad de materias primas y Utilidad por producto (Toneladas).
Pintura para Pintura para Disponibilidad
Exterior (𝑋𝑋1 ) Interior (𝑋𝑋2 ) (Toneladas)
Materia Prima 1, M1 6 4 24
Materia Prima 2, M2 1 2 6
Ut.($) por Tonelada 5 4
Fuente: Taha (2012), todos los datos en Toneladas.
En forma adicional, se tienen dos restricciones: “Una encuesta de mercado indica que la demanda
diaria de pintura para interiores no puede exceder la de pintura para exteriores en más de una
tonelada. Asimismo, que la demanda diaria máxima de pintura para interiores es de dos toneladas”.
(Taha, 2012).
Para solucionar el problema de PL primero este debe plantear.
𝑀𝑀𝑀𝑀𝑀𝑀 𝑧𝑧 = 5𝑥𝑥1 + 4𝑥𝑥2

s.a.:
6𝑥𝑥1 + 4𝑥𝑥2 ≤ 24 (L1) (Restricción M1)

𝑥𝑥1 + 2𝑥𝑥2 ≤ 6 (L2) (Restricción M2)
−𝑥𝑥1 + 𝑥𝑥2 ≤ 1 (L3) (Restricción de demanda 1)
𝑥𝑥2 ≤ 2 (L4) (Restricción de demanda 2)
𝑥𝑥1 , 𝑥𝑥2 ≥ 0 (L5) (Restricción de no negatividad) (8.3)
Una vez planteado el problema las ecuaciones se pueden reordenar de forma de graficarlas. Una
alternativa es obtener los puntos críticos de cada ecuación. Por ejemplo, para el caso de L1, cuando
𝑥𝑥2 = 0, 𝑥𝑥1 = 4, y cuando 𝑥𝑥1 = 0, 𝑥𝑥2 = 6. De esta forma L1 se grafica considerando que su
intersección con el eje de 𝑥𝑥1 corresponde a 4 y con el eje 𝑥𝑥2 corresponde a 6. Otra alternativa es
dejar L1 en función de 𝑥𝑥2 ; al realizar esto la ecuación queda como 8.4, y es claro que el intercepto
de la ecuación corresponde a 6 mientras que la pendiente es -3/2. Se puede efectuar la misma
operación en todas las restricciones, quedando estas definidas en las ecuaciones 8.4 a 8.7.
3
𝑥𝑥2 = 6 − 𝑥𝑥1 (8.4)
2
1
𝑥𝑥2 = 3 − 𝑥𝑥1 (8.5)
2
𝑥𝑥2 = 1 + 𝑥𝑥1 (8.6)
𝑥𝑥2 = 2 (8.7)
74
Figura 8.1. Gráfico del Problema 8.3
Fuente: Sobre la base de Taha (2012).

Nota: eje de las x es 𝑥𝑥1 , eje de las y es 𝑥𝑥2 .
Una vez realizado el análisis con todas las restricciones es claro que el área factible de solución al
problema corresponde al área limitada por los puntos (0, 1), (1, 2), (2, 2), (3, 1.5), (4, 0). Si bien el
planteamiento de las desigualdades en forma de ecuación permite delimitar las áreas, las
desigualdades implícitas en cada una permiten saber que sección corresponde efectivamente al área
factible. En la figura 8.1 es bastante clara la intersección entre todas las restricciones, sin embargo
el punto (3, 1.5) tiene decimales. Para encontrar este punto es necesario igualar las restricciones
que pasan por ese punto, las que corresponden a L1 y a L2; como resultado en ese punto (𝑥𝑥1 , 𝑥𝑥2 ) =
(3, 1.5). A continuación se procede a evaluar cada uno de los puntos obtenidos en la función
objetivo.
𝑧𝑧(0, 1) = 5(0) + 4(1) = 4

𝑧𝑧(1, 2) = 5(1) + 4(2) = 13
𝑧𝑧(2, 2) = 5(2) + 4(2) = 18
𝑧𝑧(3, 1.5) = 5(3) + 4(1.5) = 21
𝑧𝑧(4, 0) = 5(4) + 4(0) = 20
Entonces, la solución que maximiza la función objetivo corresponde al conjunto (𝑥𝑥1 , 𝑥𝑥2 ) = (3, 1.5),
donde 𝑧𝑧 = 21, el valor máximo que obtiene la función en los vértices definidos por el área factible.
Ejemplo 2: A continuación se analiza un caso de minimización que consiste en obtener el mínimo

costo posible de una dieta (Taha, 2012: 24, Ejemplo 2.2-2). Se consume diariamente un mínimo de
800 libras de un alimento compuesto por maíz y soya. La composición del alimento se observa en
la Tabla 8.2.
Tabla 8.2. Composición del Alimento y costo.

Forraje Proteína Fibra Costo ($/libras)
Maíz 0.09 0.02 0.30
Soya 0.60 0.06 0.90
Fuente: Taha (2012).
A su vez, “las necesidades dietéticas del alimento especial son un mínimo de 30% de proteína y un
máximo de 5% de fibra” (Taha, 2012). De acuerdo a la información anterior se procede a plantear el
problema de PL, donde 𝑥𝑥1 = libras de maíz en la mezcla diaria y 𝑥𝑥2 = libras de soya en la mezcla
diaria.
75
𝑀𝑀𝑀𝑀𝑀𝑀 𝑧𝑧 = 0.3𝑥𝑥1 + 0.9𝑥𝑥2
s.a.:
𝑥𝑥1 + 𝑥𝑥2 ≥ 800 (L1) (Restricción cantidad total)

0.09𝑥𝑥1 + 0.6𝑥𝑥2 ≥ 0.3(𝑥𝑥1 + 𝑥𝑥2 ) (L2) (Restricción de proteína)
0.02𝑥𝑥1 + 0.06𝑥𝑥2 ≤ 0.05(𝑥𝑥1 + 𝑥𝑥2 ) (L3) (Restricción de fibra)
El problema 8.8 presenta unas restricciones complicadas (L2 y L3) por lo que se puede facilitar el
análisis replanteando el problema. En 8.9 solo se simplificaron las restricciones L2 y L3.
𝑀𝑀𝑀𝑀𝑀𝑀 𝑧𝑧 = 0.3𝑥𝑥1 + 0.9𝑥𝑥2

s.a.:
𝑥𝑥1 + 𝑥𝑥2 ≥ 800 (L1) (Restricción cantidad total)

0.21𝑥𝑥1 − 0.3𝑥𝑥2 ≤ 0 (L2) (Restricción de proteína)
0.03𝑥𝑥1 − 0.01𝑥𝑥2 ≥ 0 (L3) (Restricción de fibra)
Planteado el problema se procede a graficar de la misma forma que en el ejemplo anterior,

analizando las rectas y la forma en la cual se gráfica, para lo cual es útil plantear las restricciones en
la forma de 8.10 a 8.12.
𝑥𝑥2 = 800 − 𝑥𝑥1 (8.10)
𝑥𝑥2 = 0.7𝑥𝑥1 (8.11)
𝑥𝑥2 = 3𝑥𝑥1 (8.12)
Figura 8.2. Gráfico del Problema 8.9.
Fuente: Sobre la base de Taha (2012).

Nota: eje de las x es 𝑥𝑥1 , eje de las y es 𝑥𝑥2 .
En el gráfico 8.2 se graficaron las restricciones y es claro que la zona factible está delimitada desde
el infinito hacia el cero por los puntos (200, 600) y (470.6, 329.4). El primer punto se observa
fácilmente mientras que el segundo se debe calcular como la intersección de las rectas L1 y L2.
Entonces, la intersección entre L1 y L2 corresponde al punto (470.6, 329.4). A continuación se
procede a evaluar los puntos en la función objetivo y se tiene que:
76
𝑧𝑧(200, 600) = 0.3(200) + 0.9(600) = 600
𝑧𝑧(470.6, 329.4) = 0.3(470.6) + 0.9(329.4) = 437.64
Entonces, la solución que minimiza la función objetivo corresponde al conjunto (x1 , x2 ) =

(470.6, 329.4), donde z = 437.64, el valor mínimo que obtiene la función en los vértices definidos
por el área factible.
Referencias
Peñafiel Millán, Luis, Programación Lineal: base teórica y aplicaciones administrativas; 1976, Ed.
Trillas, 1º edición, México.
Taha, Hamdy A. (2012). Investigación de operaciones. Novena edición. Pearson Educación,

México, 2012.
77
1. Una compañía fabrica dos productos, A y B. El volumen de ventas de A es por lo menos

80% de las ventas totales de A y B. Sin embargo, la compañía no puede vender más de 100
unidades de A por día. Ambos productos utilizan una materia prima, cuya disponibilidad
diaria máxima es de 240 libras. Las tasas de consumo de la materia prima son de 2 libras
por unidad de A y de 4 libras por unidad de B. Las utilidades de A y B son de $20 y $50,
respectivamente. Determine la combinación óptima de productos para la compañía (Taha,
2012).
2. El gobierno debe encargarse del proceso de reconstrucción debido a los desastres ocurridos
luego de un terremoto, para lo que cuenta con dos bienes cuya valoración puede compensar
a las personas por las pérdidas sufridas. El bien 𝑥𝑥1 tiene la cualidad de compensar las
pérdidas por bienes inmuebles de los damnificados por un valor de $2.000, mientras que el
bien 𝑥𝑥2 por un valor de $3.000. Sin embargo, dada la gravedad de la situación post-desastre,
y las demandas de la ciudadanía por una actuación rápida del gobierno, éste se ha puesto
plazos para producir los bienes 𝑥𝑥1 y 𝑥𝑥2 , es decir, ha definido dos fases de producción. Para
la primera fase solo dispone de 50 horas, y producir una unidad del bien 𝑥𝑥1 requiere de 12
horas, mientras que para producir una unidad del bien 𝑥𝑥2 se requieren 23 horas. Para la
segunda fase, se dispone de 45 horas, y ahora producir una unidad de 𝑥𝑥1 corresponde a 16
horas, mientras que producir una unidad de 𝑥𝑥2 corresponde a 10 horas. Grafique y
encuentre el óptimo, considerando cantidades positivas de 𝑥𝑥1 y 𝑥𝑥2 .
3. Use el método gráfico para encontrar los valores de 𝑥𝑥1 y 𝑥𝑥2 que maximizan la función
objetivo, 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) en cada uno de los siguientes casos 3:
a) 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = 3𝑥𝑥1 + 2𝑥𝑥2

b) 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = 5𝑥𝑥1 + 2𝑥𝑥2
c) 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = 2𝑥𝑥1 + 3𝑥𝑥2
d) 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = 3𝑥𝑥1 + 3𝑥𝑥2
Las restricciones en todos los casos son:

2𝑥𝑥1 + 3𝑥𝑥2 ≤ 12
4𝑥𝑥1 + 2𝑥𝑥2 ≤ 16
𝑥𝑥1 , 𝑥𝑥2 ≥ 0
4. Usé el método gráfico para resolver el siguiente problema 4:
Min 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = −𝑥𝑥1 − 𝑥𝑥2

s.a.:
𝑥𝑥1 + 3𝑥𝑥2 ≤ 6
−𝑥𝑥1 + 𝑥𝑥2 ≤ 1
−2𝑥𝑥1 + 𝑥𝑥2 ≥ −4
𝑥𝑥1 , 𝑥𝑥2 ≥ 0
3
Gonzalo Edwards (1994). “Modelos de Optimización”. Trabajo Docente Nº 57, Instituto de Economía, Pontificia Universidad Católica
de Chile. ISSN: 0716-7334.
4
Ídem.
78
9. Introducción al Modelo de Regresión Lineal.
Entre los objetivos de este documento se encuentra la comprensión de los fenómenos sociales desde
el punto de vista de la dimensión cuantitativa. Para esto se han analizado una serie de estadísticos
que nos permiten obtener información de forma inteligente de los datos. Un momento superior del
análisis cuantitativo dice relación con la conformación del modelo. Tal como vimos en instancias
anteriores, dicho modelo se elabora como una explicación a la realidad, y puede considerar
diferentes variables.
Una forma de obtener un modelo que interrelacione variables es la aplicación del Modelo de
Mínimos Cuadrados Ordinarios (MCO). Es menester considerar que esta relación no corresponde a
la realidad misma, por el contrario, es una interpretación de esta. Asimismo, MCO no permite
establecer causalidad entre dos variables, toda vez que dicha causalidad proviene en primera
instancia del marco teórico que vincule las variables. Una vez que hemos hecho la revisión teórica
respectiva, podemos estar interesados en testear la hipótesis que se deriva de la teoría de forma
empírica, usando para ello el MCO.
Las siguientes secciones no pretenden ser tanto una exposición detallada del análisis de regresión
como una motivación e introducción al mismo. Dado el número de aspectos, especificidades y
problemas que trata el análisis de regresión se recomienda acudir a los textos usualmente usados
como Gujarati (2004) y Wooldridge (2010), así como también a la sección respectiva de Levin y
Levin (1999).
9.1. Modelo de Mínimos Cuadrados Ordinarios (MCO)
Para elaborar un modelo que interrelaciona dos variables, por ejemplo X e Y, debemos recurrir a una
relación matemática básica, que relaciona las variables en función de un intercepto, 𝛽𝛽0 , y una
pendiente, 𝛽𝛽1 . Esta es una relación determinista, que nos dice cuanto cambia Y a partir de la
variación en una unidad de X:
𝑌𝑌𝑖𝑖 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 (9.1)
Donde Y corresponde a la variable endógena o explicada, y X a la variable exógena o explicativa.

En las ciencias físicas es común ocupar modelos matemáticos, los que tienen una alta capacidad
explicativa y predictiva. Esto explica el gran crecimiento de las ciencias y la tecnología desde la
revolución industrial.
Sin embargo, en las ciencias sociales existen algunos factores que pueden relativizar la relación
entre las variables, tales como el comportamiento humano, que se caracteriza por ser irracional, la
presencia de errores de medición, y la necesidad de obtener muestras (ya sabemos las restricciones)
entre otras, razón por lo que es necesario incorporar un componente que agrupe toda esa
incertidumbre. En este punto, se debe desechar el modelo matemático por cuanto nos plantea una
relación determinista, y perfeccionarlo a través de un modelo estadístico:
𝑌𝑌𝑖𝑖 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 + 𝜀𝜀𝑖𝑖 (9.2)
Donde 𝜀𝜀𝑖𝑖 corresponde a la perturbación estocástica (residuo), y representa todas aquellas cosas que
afectan a Y, pero que no están de forma explícita en el modelo. Cabe destacar que el MCO tiene una
serie de supuestos, los que corresponden a linealidad en los parámetros, muestreo aleatorio, no
79
colinealidad perfecta, media condicional cero, y homocedasticidad (Wooldridge, 2010: 84), los que
se detallan a continuación.
9.2. Supuestos del MCO.
Siguiendo a Wooldridge (2010), los supuestos del modelo de MCO corresponden a los siguientes.
Estos supuestos se extienden al caso del modelo multivariable.
1. Linealidad en los parámetros: como se desprende de la ecuación 9.2, el MCO supone

linealidad en los parámetros, esto es, que los coeficientes a estimar sean constantes tal como
en el caso de la ecuación señalada para 𝛽𝛽𝑜𝑜 y 𝛽𝛽1 . Esto no quiere decir que las formas
funcionales presenten no linealidades, tales como la presencia de un x elevado al cuadrado
o al cubo. Por el contrario, puedes existir relaciones no lineales entre las variables, lo
importante es que la linealidad sea respecto de los parámetros a estimar.
2. Muestreo aleatorio: los datos mediante los cuales se efectúa el análisis de regresión
corresponden a datos extraídos de una muestra aleatoria.
3. No existencia de colinealidad perfecta: no existe una relación exacta entre las variables
independientes. Este supuesto es importante cuando se considera un modelo con múltiples
variables independientes.
4. Media condicional cero: este supuesto indica que el valor esperado condicional del error es
igual a cero, esto es:
𝐸𝐸(𝜀𝜀|x1 , 𝑥𝑥2 , … 𝑥𝑥𝑘𝑘 ) = 0 (9.3)
5. Homocedasticidad: la varianza del error es constante, esto es:
𝑉𝑉𝑉𝑉𝑉𝑉(𝜀𝜀|x1 , 𝑥𝑥2 , … 𝑥𝑥𝑘𝑘 ) = 𝜎𝜎 2 (9.4)
6. Supuesto de Normalidad: el error 𝜀𝜀 es independiente de las variables explicativas y está

distribuido de forma normal, con media cero y varianza 𝜎𝜎 2 , esto es, 𝜀𝜀~𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁(0, 𝜎𝜎 2 ).
Bajo los supuestos 1 a 4, es posible formular el teorema de insesgamiento de los estimadores MCO,
esto es, que “los estimadores MCO son estimadores insesgados de los parámetros poblacionales”
(Wooldridge, 2010). Bajo los supuestos 1 a 5, el estimador MCO es el mejor estimador lineal
insesgado (MELI) de 𝛽𝛽0 , 𝛽𝛽1 , … 𝛽𝛽𝑘𝑘 . El supuesto 6 es el más fuerte de todos pues supone que los
supuesto 1 a 5 son verdaderos (Wooldridge, 2010). Por último, todos estos supuestos en conjunto
conforman el Modelo Clásico de Regresión Lineal.
9.3. Estimación por MCO.
Dado que en estricto rigor no es posible observar todos los datos de la población, no es posible
estimar la ecuación 9.2, la que corresponde a la Función de Regresión Poblacional (FRP); es por
esto que dicha función debe ser estimada a través de la Función de Regresión Muestral (FRM)
(Guajarati, 2004):
𝑌𝑌𝑖𝑖 = 𝛽𝛽̂𝑜𝑜 + 𝛽𝛽̂1 𝑋𝑋𝑖𝑖 + 𝜀𝜀̂𝑖𝑖 (9.5)
80
�𝚤𝚤 + 𝜀𝜀̂𝑖𝑖
𝑌𝑌𝑖𝑖 = 𝑌𝑌 (9.6)
�𝚤𝚤 = 𝛽𝛽̂𝑜𝑜 + 𝛽𝛽̂1 𝑋𝑋𝑖𝑖 , y los valores con gorro (^) son los valores estimados. Dado que el método
Donde 𝑌𝑌
MCO minimiza las diferencias de los residuos al cuadrado, se debe plantear el problema de
optimización como en 9.7.
𝑀𝑀𝑀𝑀𝑛𝑛𝛽𝛽�𝑜𝑜, 𝛽𝛽�1 ∑ 𝜀𝜀̂𝑖𝑖2

�𝚤𝚤 �2
𝑀𝑀𝑀𝑀𝑛𝑛𝛽𝛽�𝑜𝑜, 𝛽𝛽�1 ∑�𝑌𝑌𝑖𝑖 − 𝑌𝑌
2
𝑀𝑀𝑀𝑀𝑛𝑛𝛽𝛽�𝑜𝑜, 𝛽𝛽�1 ∑�𝑌𝑌𝑖𝑖 − 𝛽𝛽̂𝑜𝑜 − 𝛽𝛽̂1 𝑋𝑋𝑖𝑖 � (9.7)
Para resolver la expresión 9.7 se deben obtener las condiciones de primer orden respecto de 𝛽𝛽̂𝑜𝑜 y de
𝛽𝛽̂1 , las que se corresponden a las ecuaciones 9.8 y 9.9.
2
�𝑜𝑜−𝛽𝛽
𝜕𝜕 ∑�𝑌𝑌𝑖𝑖 −𝛽𝛽 �1 𝑋𝑋𝑖𝑖 �
�𝑜𝑜
𝜕𝜕𝛽𝛽
=0
2 ∑�𝑌𝑌𝑖𝑖 − 𝛽𝛽̂𝑜𝑜 − 𝛽𝛽̂1 𝑋𝑋𝑖𝑖 � (−1) = 0
∑�𝑌𝑌𝑖𝑖 − 𝛽𝛽̂𝑜𝑜 − 𝛽𝛽̂1 𝑋𝑋𝑖𝑖 � = 0 (9.8)
2
�𝑜𝑜−𝛽𝛽
𝜕𝜕 ∑�𝑌𝑌𝑖𝑖 −𝛽𝛽 �1 𝑋𝑋𝑖𝑖 �
�1 =0
𝜕𝜕𝛽𝛽
2 ∑�𝑌𝑌𝑖𝑖 − 𝛽𝛽̂𝑜𝑜 − 𝛽𝛽̂1 𝑋𝑋𝑖𝑖 � (−𝑋𝑋𝑖𝑖 ) = 0
∑�𝑌𝑌𝑖𝑖 − 𝛽𝛽̂𝑜𝑜 − 𝛽𝛽̂1 𝑋𝑋𝑖𝑖 � (−𝑋𝑋𝑖𝑖 ) = 0 (9.9)
Una vez obtenidas las condiciones de primer orden, es posible obtener los estimadores MCO.
Multiplicando 9.8 por (1/n) y aplicando la sumatoria sobre todos los componentes, se obtiene 9.10.
∑�𝑌𝑌𝑖𝑖 − 𝛽𝛽̂𝑜𝑜 − 𝛽𝛽̂1 𝑋𝑋𝑖𝑖 � (1/𝑛𝑛) = 0

∑ 𝑌𝑌𝑖𝑖 �𝑜𝑜
𝑛𝑛𝛽𝛽 �1 ∑ 𝑋𝑋𝑖𝑖
𝛽𝛽
− − =0
𝑛𝑛 𝑛𝑛 𝑛𝑛
𝑌𝑌� − 𝛽𝛽̂𝑜𝑜 − 𝛽𝛽̂1 𝑋𝑋� = 0

𝛽𝛽̂𝑜𝑜 = 𝑌𝑌� − 𝛽𝛽̂1 𝑋𝑋� (9.10)
La expresión 9.10 es una expresión para el intercepto de la ecuación. Sin embargo, aún se necesita
una expresión para 𝛽𝛽̂1 en orden a obtener su valor. Reemplazando la expresión 9.10 en 9.9 se
obtiene:
∑�𝑌𝑌𝑖𝑖 − 𝛽𝛽̂𝑜𝑜 − 𝛽𝛽̂1 𝑋𝑋𝑖𝑖 � (−𝑋𝑋𝑖𝑖 ) = 0

∑�𝑌𝑌𝑖𝑖 − 𝑌𝑌� + 𝛽𝛽̂1 𝑋𝑋� − 𝛽𝛽̂1 𝑋𝑋𝑖𝑖 � (−𝑋𝑋𝑖𝑖 ) = 0
− ∑(𝑌𝑌𝑖𝑖 − 𝑌𝑌�)(𝑋𝑋𝑖𝑖 ) − 𝛽𝛽̂1 ∑(𝑋𝑋� − 𝑋𝑋𝑖𝑖 )(𝑋𝑋𝑖𝑖 ) = 0
− ∑(𝑌𝑌𝑖𝑖 − 𝑌𝑌�)(𝑋𝑋𝑖𝑖 ) + 𝛽𝛽̂1 ∑(𝑋𝑋𝑖𝑖 − 𝑋𝑋�)(𝑋𝑋𝑖𝑖 ) = 0
81
∑(𝑌𝑌 −𝑌𝑌�)(𝑋𝑋 )
𝛽𝛽̂1 = ∑(𝑋𝑋𝑖𝑖 −𝑋𝑋�)(𝑋𝑋𝑖𝑖 ) (9.11)
𝑖𝑖 𝑖𝑖
A continuación, multiplicando numerador y denominador de la expresión 9.11 por 1/n se tiene lo

siguiente:
∑(𝑌𝑌 −𝑌𝑌�)(𝑋𝑋 ) 1/𝑛𝑛

𝛽𝛽̂1 = ∑(𝑋𝑋𝑖𝑖−𝑋𝑋�)(𝑋𝑋𝑖𝑖 )
𝑖𝑖 𝑖𝑖 1/𝑛𝑛
� ��𝑋𝑋 �
∑�𝑌𝑌𝑖𝑖 −𝑌𝑌 𝑖𝑖
𝛽𝛽̂1 = 𝑛𝑛
�
∑�𝑋𝑋𝑖𝑖 −𝑋𝑋��𝑋𝑋𝑖𝑖 �
𝑛𝑛
� ∑ 𝑋𝑋
∑ 𝑌𝑌𝑖𝑖 𝑋𝑋𝑖𝑖 −𝑌𝑌 𝑖𝑖
𝛽𝛽̂1 = 2
∑ 𝑋𝑋𝑖𝑖 −𝑋𝑋
𝑛𝑛
� ∑ 𝑋𝑋
𝑖𝑖
𝑛𝑛
∑ 𝑌𝑌𝑖𝑖 𝑋𝑋𝑖𝑖 � ∑ 𝑋𝑋
𝑌𝑌
− 𝑖𝑖
∑ 𝑋𝑋2 �
𝑛𝑛
𝑖𝑖 − 𝑋𝑋 ∑ 𝑋𝑋𝑖𝑖
𝑛𝑛 𝑛𝑛
∑ 𝑌𝑌𝑖𝑖 𝑋𝑋𝑖𝑖
− 𝑌𝑌�𝑋𝑋�
∑ 𝑋𝑋2
(9.12)
𝑖𝑖 − 𝑋𝑋� 2
𝑛𝑛
Si se considera la expresión 9.12, es claro que está conformada por dos estadísticos conocidos, por
la varianza (fórmula 4.17) y la covarianza (fórmula 5.6), por lo que la ecuación 9.12 se puede
plantear como la 9.13.
𝑐𝑐𝑐𝑐𝑐𝑐(𝑋𝑋,𝑌𝑌)
𝛽𝛽̂1 = (9.13)
𝑣𝑣𝑣𝑣𝑣𝑣(𝑥𝑥)
En este contexto ya es posible estimar una ecuación de regresión lineal por MCO a través de la
fórmula 9.10 y 9.12.
Referencias.
Gujarati, Damodar (2004). Econometría. 4ta edición. McGraw-Hill Interamericana.
Wooldridge, Jeffrey M. (2010). “Introducción a la econometría: Un enfoque moderno”. 4ta. edición.

Cengage Learning Editores, S.A. de C.V. ISBN-13: 978-607-481-312-8, ISBN-10: 607-481-312-4.
82
5. Suponga que tiene los siguientes datos, y se le pide que modele la calificación de los
alumnos en establecimientos de vulnerabilidad. Las variables son:
X= Tiempo que dedican a estudiar los alumnos de colegios en vulnerabilidad a estudiar en

minutos.
Y= Calificación del alumno.
Tiene la siguiente base de datos:
Tabla 1
X Y
58 4.5
40 4.7
32 4.5
65 5.7
21 4.0
15 3.4
80 6.5
6. Usted está estudiando la relación entre el ingreso y la escolaridad y dispone de la siguiente

base de datos. Estime el modelo correspondiente.
Tabla 2
Escolaridad (X) Ingreso (Y)
9 10
8 11
6 5
7 8
7 7
4 5
3 3
2 1
83
10. Modelo de Regresión Lineal: Ajuste e Inferencia.
En esta sección veremos los estadísticos que tienen por objeto determinar si nuestro modelo se
ajusta bien a los datos, efectuaremos pruebas estadísticas respecto a la significancia de los
coeficientes, y se efectuará una lectura global del modelo.
10.1. Bondad de Ajuste (R2)
En la sección anterior se analizó cómo estimar la relación lineal entre dos variables utilizando para
ello el MCO. Sin embargo, una vez que se ha estimado el modelo, es necesario preguntarse respecto
al grado de ajuste de dicho modelo, entendiendo por esto qué tan bien se ajusta a los datos
empíricos. Para responder a esta pregunta es necesario revisar algunos conceptos de importancia.
Figura 10.1: Función de Regresión Población (FRP) y

Función de Regresión Muestral (FRM)
Y
FRM
Yi 𝜀𝜀̂
Ŷ ɛ
E(Y/X) = Y FRP
Yi = βˆ0 + βˆ1 X i
Xi X
Fuente: Gujarati (2004)
En la figura 10.1 se observa la función de regresión población (FRP), es decir, la verdadera relación
de las variables en la población, y por otro lado, la función de regresión muestral (FRM), que es la
relación estimada a través del Método MCO. Si se fija la atención en el punto 𝑋𝑋𝑖𝑖 , 𝑌𝑌𝑖𝑖 , se puede ver
que a través de la línea formada por el punto 𝑋𝑋𝑖𝑖 pasan ambas funciones generando tramos dentro de
esa línea. Estos tramos permiten hablar de los siguientes conceptos.
La suma total de cuadrados (STC): ∑𝑛𝑛𝑖𝑖=1(𝑌𝑌𝑖𝑖 − 𝑌𝑌�)2 (10.1)
2
La suma de cuadrados explicada (SEC): ∑𝑛𝑛𝑖𝑖=1�𝑌𝑌�𝑖𝑖 − 𝑌𝑌�� (10.2)
2
La suma de residuos al cuadrado (SRC): ∑𝑛𝑛𝑖𝑖=1�𝑌𝑌𝑖𝑖 − 𝑌𝑌�𝑖𝑖 � (10.3)
Entonces, la STC corresponde a las distancias totales entre una observación en el plano X,Y y el
promedio respectivo de Y, la SEC a la suma de las distancias entre el punto respectivo en la FRM y
el promedio de Y, mientras que la SRC corresponde a la suma de las distancias entre una
observación y el punto respectivo sobre la FRM. Todas estas distancias son elevadas al cuadrado,
tal como se indica en las ecuaciones 10.1 a 10.3. Dada la interrelación que presentan estas
ecuaciones, es que es posible formular la siguiente ecuación, la que es equivalente a 10.5.
2 2
∑𝑛𝑛𝑖𝑖=1(𝑌𝑌𝑖𝑖 − 𝑌𝑌�)2 = ∑𝑛𝑛𝑖𝑖=1�𝑌𝑌�𝑖𝑖 − 𝑌𝑌�� + ∑𝑛𝑛𝑖𝑖=1�𝑌𝑌𝑖𝑖 − 𝑌𝑌�𝑖𝑖 � (10.4)
84
STC = SEC + SRC (10.5)
Multiplicando la última ecuación por (1/STC), se llega a:
SEC SRC
=1− = R2 (10.6)
SCT SCT
Esta última ecuación es la ecuación del coeficiente de determinación, e indica la proporción en la

cual el modelo explica (SEC) lo que “debería” explicar (SCT). Este estadístico se distribuye de “0”
a “1”, donde “0” es nula bondad de ajuste y “1” es bondad de ajuste total. Por ejemplo, si la SRC=
8.115 y SCT=81.5, entonces 𝑅𝑅 2=0.90, por lo que la ecuación estimada tendría un alto ajuste
respecto de los datos.
10.2. Test estadísticos.
Los supuestos 1 a 6 de la sección anterior permiten elaborar un teorema para definir la distribución
de los coeficientes estimados con MCO. Dicho teorema se describe a continuación (Wooldridge,
2010: 120): Bajo los supuestos 1 a 6 del Modelo de Regresión Lineal Clásico:
𝛽𝛽̂𝑗𝑗 ~𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁(𝛽𝛽𝑗𝑗 , 𝑣𝑣𝑣𝑣𝑣𝑣(𝛽𝛽̂𝑗𝑗 )) (10.7)
�𝑗𝑗 −𝛽𝛽𝑗𝑗 �
�𝛽𝛽
�𝑗𝑗 � ~𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁(0, 1)
𝑑𝑑𝑑𝑑�𝛽𝛽
(10.8)
Lo que quiere decir que la distribución de los coeficientes es normal con media 𝛽𝛽𝑗𝑗 y varianza
𝑣𝑣𝑣𝑣𝑣𝑣(𝛽𝛽̂𝑗𝑗 ), y que �𝛽𝛽̂𝑗𝑗 − 𝛽𝛽𝑗𝑗 �/𝑑𝑑𝑑𝑑�𝛽𝛽̂𝑗𝑗 � se distribuye normal con media 0 y varianza 1. Este teorema es vital
pues permite plantear test de hipótesis sobre los coeficientes, tal como se verá en las siguientes
secciones.
10.2.1. Test de hipótesis: Coeficientes individuales.
Una vez estimado el modelo de regresión lineal es importante preguntarse respecto de la

significancia de los coeficientes estimados. En este sentido, en la sección de inferencia estadística se
analizó un test que permitía dirimir si dos medias eran distintas; en esta sección nos podemos
preguntar respecto a si un coeficiente estimado difiere de cero, por ejemplo. Esta última pregunta es
realmente relevante, puesto que si 𝛽𝛽̂1 no difiere de cero, entonces el modelo 10.9 implicaría que
�𝚤𝚤 = 𝛽𝛽̂0 , o en otras palabras, que no existe relación entre X e Y.
𝑌𝑌
�𝚤𝚤 = 𝛽𝛽̂𝑜𝑜 + 𝛽𝛽̂1 𝑋𝑋𝑖𝑖

𝑌𝑌 (10.9)
Es por eso que en econometría un test de primera relevancia es que el coeficiente de interés es igual
a cero, lo que se formaliza en 10.10.
a) Planteamiento de Hipótesis
𝐻𝐻𝑜𝑜 : 𝛽𝛽1 = 0
𝐻𝐻1 : 𝛽𝛽1 ≠ 0 (10.10)
85
b) Estadístico: al igual que en el caso del test de medias, en este caso se plantea el estadístico,
el que corresponde, para el caso de 𝛽𝛽̂1 a:
�1 −𝛽𝛽1
𝛽𝛽
�1 � ~𝑡𝑡𝑛𝑛−2
𝑒𝑒𝑒𝑒�𝛽𝛽
(10.11)
Donde t se distribuye con n-2 grados de libertad, debido a que para calcular la suma de residuos al
cuadrado, primero se están calculando dos coeficientes, 𝛽𝛽̂0 y 𝛽𝛽̂1 , lo que impone dos restricciones al
análisis (Gujarati, 2004). Entonces, para modelos más generales, el estadístico corresponde a:
�𝑗𝑗 −𝛽𝛽𝑗𝑗
𝛽𝛽
�𝑗𝑗 � ~𝑡𝑡𝑛𝑛−𝑘𝑘−1
𝑒𝑒𝑒𝑒�𝛽𝛽
(10.12)
Donde k corresponde a los coeficientes de variables independientes, y 1 a la constante.
c) Criterio de rechazo de la nula: en general, el lado izquierdo de la ecuación 10.12 arroja un

valor que se denomina t calculado (𝑡𝑡 𝑐𝑐 ), y luego ese valor se debe cotejar con el valor
teórico (𝑡𝑡 ∗ ) que hubiese tomado el t con los grados de libertad y la significancia respectiva.
La hipótesis nula se rechaza cuando se cumple que |𝑡𝑡 𝑐𝑐 | > 𝑡𝑡 ∗ . En este sentido, el rechazo de
la nula implica que el 𝑡𝑡 𝑐𝑐 se encuentra fuera de la región de aceptación de la hipótesis nula,
esto es, fuera de la zona en la cual el coeficiente vale cero.
Ejemplo 1: para el caso de un modelo donde la mortalidad infantil es la variable dependiente, se

tiene que el coeficiente estimado para el PIB per cápita es -0.0056, su error estándar es 0.002, se
tienen 64 observaciones, y se usa un nivel de significancia del 5%. Además, el modelo tiene solo
dos variables independientes (Gujarati, 2004: 240).
En este caso la hipótesis nula implica que el coeficiente del PIB per cápita es igual a cero, mientras
la alternativa, que no lo es. El 𝑡𝑡 𝑐𝑐 corresponde a:
−0.0056
𝑡𝑡 𝑐𝑐 = = −2.8
0.002
Mientras que el 𝑡𝑡 ∗ con 61 grados de libertad, probabilidad de 0.05, y a una y dos colas, es
respectivamente:
∗ ∗
𝑡𝑡64−2−1 𝛼𝛼 = 𝑡𝑡61 𝛼𝛼 = 1.671
∗ ∗
𝑡𝑡64−2−1 𝛼𝛼/2 = 𝑡𝑡61 𝛼𝛼/2 = 2
Haciendo un análisis de una cola o dos colas se cumple que |𝑡𝑡 𝑐𝑐 | > 𝑡𝑡 ∗ , por lo que se rechaza la
hipótesis nula.
10.2.2. P-value.
Sin embargo, existe otro enfoque equivalente que permite rechazar o no rechazar la hipótesis nula, y
que dice relación con el p-value. El p-value es el nivel exacto de significancia o probabilidad de
cometer error tipo I (Gujarati, 2004: 131), error que indica la probabilidad de equivocarse al
rechazar la hipótesis nula si esta fuese verdadera. En términos formales:
𝑝𝑝(𝑡𝑡 ∗ > 𝑡𝑡 𝑐𝑐 ) = 𝑝𝑝(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼) (10.13)
86
Por lo que es un enfoque similar al anterior, salvo que para rechazar la hipótesis nula, en este caso
la probabilidad de que 𝑡𝑡 ∗ > 𝑡𝑡 𝑐𝑐 ocurra debe ser lo más baja posible, minimizando al mismo tiempo el
error tipo I. De esta forma, si la probabilidad que 𝑡𝑡 ∗ > 𝑡𝑡 𝑐𝑐 es baja, entonces la probabilidad de que
𝑡𝑡 𝑐𝑐 > 𝑡𝑡 ∗ es alta. Sin embargo, aún se requiere fijar el criterio de rechazo de la nula, y
tradicionalmente se adopta una significancia de 10%, 5% o 1%.
Ejemplo 2: Para del modelo de la mortalidad infantil, el p-value del PIB per cápita es 0.0065. Bajo
el enfoque del p-value se rechaza la hipótesis nula al 1% de significancia, por lo que el coeficiente
del PIB per cápita es distinto de cero. Como se observa, el enfoque es más preciso y da el mismo
resultado del Ejemplo 1.
Ejemplo 3: En la Tabla 10.1 se estimó un modelo en el cual Y=ingreso en unidad monetaria, y X=

escolaridad en años. La relación teórica entre las variables es que un aumento de la escolaridad en
años produce un aumento en el ingreso en unidades monetarias. En este sentido el coeficiente de la
variable escolaridad implica que por cada año de estudio, el ingreso se incrementa en 0.04 unidades
monetarias. Respecto del grado de ajuste del modelo, la primera sub tabla (Tabla ANOVA 5) indica
la información necesaria, donde “SS Model” corresponde la SEC y “SS Residual” a la SRC, por lo
que el coeficiente de determinación es igual a SEC/SCT=5.5836/6.4771=0.8621, que es el mismo
valor que aparece en la segunda sub tabla bajo el nombre “R-squared”.
Respecto de la significancia de los parámetros estimados, la tabla arroja el error estándar y el 𝑡𝑡 𝑐𝑐

para ambos coeficientes, 𝛽𝛽̂𝑜𝑜 y 𝛽𝛽̂1 , 0.0402/0.007185=5.59 y 2.9728/0.357=8.33, y también arroja el
p-value. De acuerdo a este último enfoque, se rechaza la hipótesis nula para ambos coeficientes al
1% de significancia (P>|t|). En forma adicional, la tabla arroja intervalos de confianza al 95% para
ambos coeficientes.
Tabla 10.1. Modelo de Regresión.

reg y x
Source | SS df MS Number of obs = 7

-------------+------------------------------ F( 1, 5) = 31.25
Model | 5.58363298 1 5.58363298 Prob > F = 0.0025
Residual | .893509285 5 .178701857 R-squared = 0.8621
-------------+------------------------------ Adj R-squared = 0.8345
Total | 6.47714226 6 1.07952371 Root MSE = .42273
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x | .0401618 .0071849 5.59 0.003 .0216925 .0586311
_cons | 2.972813 .3569679 8.33 0.000 2.055198 3.890428
------------------------------------------------------------------------------
5
Análisis de Varianza.
87
Referencias.


88
11. Modelo de Regresión Multivariado.
El modelo que se ha desarrollado hasta el momento es bastante flexible y permite modelar una serie
de fenómenos que se observan en la realidad. En este punto cabe recordar que la elaboración del
modelo proviene de la teoría en una primera instancia, para luego ser formalizado a través de las
técnicas que se describen en esta sección y en la anterior. Y en relación a esto, se tiene que en la
realidad la explicación de un fenómeno no proviene solo de una variable, por el contrario, proviene
de un conjunto de variables que pueden afectarlo. Por ejemplo, al tratar de explicar la autonomía
financiera de las municipalidades, podemos adoptar el modelo 11.1, donde Y corresponde a la razón
entre ingresos propios permanentes 6 y el ingreso total municipal, y X 1 corresponde a un índice de
gestión financiera municipal. La teoría inherente a este modelo es que municipalidades que realicen
una mejor gestión financiera podrían tener un mayor índice de autonomía.
𝑌𝑌𝑖𝑖 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋1𝑖𝑖 + 𝜀𝜀𝑖𝑖 (11.1)
Sin embargo, puede que este no sea un modelo tan “correcto”, pues los ingresos propios
permanentes de las municipalidades, y por ende su grado de autonomía, dependen no solo de la
gestión del Director de Finanzas respectivo, sino que en gran parte del origen de su financiamiento,
el que se da a nivel local. En consecuencia, podríamos plantear otras variables de influencia sobre la
autonomía financiera, tales como el ingreso per cápita de los habitantes de la comuna, X 2 , la
ubicación respecto de la capital regional en km, X 3, etc… por lo que modelo podría quedar como
11.2.
𝑌𝑌𝑖𝑖 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋1𝑖𝑖 + 𝛽𝛽2 𝑋𝑋2𝑖𝑖 + 𝛽𝛽3 𝑋𝑋3𝑖𝑖 + 𝜀𝜀𝑖𝑖 (11.2)
En la práctica, la estimación de los coeficientes de la ecuación 11.2 se lleva a cabo a través de

softwares estadísticos, o incluso a través de Microsoft Excel. No obstante, dado que la inferencia
estadística es un problema de primer orden en el modelo con una variable explicativa, es también
importante en el modelo multivariado.
11.1. Test de hipótesis: Significancia Global.
Para el caso del modelo multivariado, aparte de las pruebas de hipótesis de coeficiente individuales,
es posible hacer un test de significancia global, el que tiene por objeto analizar la significancia de
todos los coeficientes de pendiente estimados. De esta forma, la hipótesis es que todos los
coeficientes estimados son simultáneamente iguales a cero. Dado el modelo 11.3, a continuación se
formaliza la aplicación del test (Gujarati, 2004: 256).
𝑌𝑌𝑖𝑖 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑖𝑖 + 𝛽𝛽3 𝑋𝑋3𝑖𝑖 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘𝑘𝑘 + 𝜀𝜀𝑖𝑖 (11.3)
a) Planteamiento de Hipótesis:
𝐻𝐻𝑜𝑜 : 𝛽𝛽2 = 𝛽𝛽3 = ⋯ = 𝛽𝛽𝑘𝑘 = 0

𝐻𝐻1 : no todos los coeficientes son simultáneamente cero. (11.4)
6
Estos ingresos se encuentran compuestos principalmente por el impuesto territorial, patentes municipales y permisos de
circulación, y representan el ingreso que se produce a nivel local y que las municipalidades reciben con una mayor
certeza. Se propone como componente del índice de autonomía pues no considera las transferencias desde el gobierno
central.
89
b) Estadístico: El estadístico corresponde a 11.5, donde (𝑘𝑘 − 1) son los grados de libertad del
numerador y (𝑛𝑛 − 𝑘𝑘) los grados de libertad del denominador.
𝑆𝑆𝑆𝑆𝑆𝑆/(𝑘𝑘−1)
𝐹𝐹 = (11.5)
𝑆𝑆𝑆𝑆𝑆𝑆/(𝑛𝑛−𝑘𝑘)
c) Criterio de rechazo de la nula: si 𝐹𝐹 > 𝐹𝐹𝛼𝛼 (𝑘𝑘 − 1, 𝑛𝑛 − 𝑘𝑘) se rechaza la hipótesis nula al nivel
de confianza determinado (𝛼𝛼).
Ejemplo 1: en la Tabla 11.1 se puede observar el análisis ANOVA para el ejemplo del modelo de
Mortalidad Infantil de la sección anterior. En la Tabla se observa la SEC, la SRC, y los grados de
libertad. Recordar que en este caso se estiman estimando 3 parámetros (k=3), pues el modelo tiene
dos variables independientes, y hay 64 observaciones; entonces 𝑆𝑆𝑆𝑆𝑆𝑆/(𝑘𝑘 − 1) = 128,681.2, y
𝑆𝑆𝑆𝑆𝑆𝑆/(𝑛𝑛 − 𝑘𝑘) =1,742.88.
Tabla 11.1. Tabla ANOVA para Mortalidad Infantil

Suma de
Suma de
Fuente de Variación gl. Promedio de
Cuadrados
Cuadrados
Regresión (SEC) 257,362.4 2 128,681.2
Residuos (SRC) 106,315.6 61 1,742.88
Total (STC) 363,678 63
Fuente: Gujarati (2004: 247)
Con estos datos, el estadístico corresponde a:

128,681.2
𝐹𝐹 = = 73.8325
1,742.88
Y dado que 𝐹𝐹0.05 (2, 60) = 3.15, entonces se rechaza la hipótesis nula al 5%. Por otro lado, al 1%
sería 𝐹𝐹0.01 (2, 60) = 4.98, por lo que también se rechaza la hipótesis nula en este caso al 1% (Ver
tablas estadísticas al final del libro Levin y Levin (1999)).
11.2. Test de Significancia Global: fórmula alternativa.
Dada la ecuación 11.5 es posible realizar un test de significancia global de una forma adicional, la
que está relacionada a la forma de cálculo del test. Si reemplaza la ecuación 10.6 en 11.5 se tiene:
𝑆𝑆𝑆𝑆𝑆𝑆/(𝑘𝑘−1)
𝐹𝐹 =
𝑆𝑆𝑆𝑆𝑆𝑆/(𝑛𝑛−𝑘𝑘)
𝑆𝑆𝑆𝑆𝑆𝑆 (𝑛𝑛−𝑘𝑘)
𝐹𝐹 = (Se reemplaza la ecuación 10.6 en SEC)
𝑆𝑆𝑆𝑆𝑆𝑆 (𝑘𝑘−1)
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑅𝑅2 (𝑛𝑛−𝑘𝑘)
𝐹𝐹 = 𝑆𝑆𝑆𝑆𝑆𝑆 (𝑘𝑘−1)
(Se reemplaza la ecuación 10.6 en SRC)
𝑆𝑆𝑆𝑆𝑆𝑆𝑅𝑅2 (𝑛𝑛−𝑘𝑘)
𝐹𝐹 = (1−𝑅𝑅2 )𝑆𝑆𝑆𝑆𝑆𝑆
(𝑘𝑘−1)
𝑅𝑅2 (𝑛𝑛−𝑘𝑘)
𝐹𝐹 =
(1−𝑅𝑅2 ) (𝑘𝑘−1)
90
Reordenando la última ecuación queda la expresión 11.6. Cabe destacar que esta expresión es
bastante útil pues se puede obtener usando directamente el 𝑅𝑅 2.
𝑅𝑅2 /(𝑘𝑘−1)
𝐹𝐹 = (11.6)
(1−𝑅𝑅2 )/(𝑛𝑛−𝑘𝑘)
Ejemplo 2: en la Tabla 11.1 se puede observar el análisis ANOVA para el ejemplo del modelo de
Mortalidad Infantil de la sección anterior. De la tabla se desprende que el 𝑅𝑅 2=SEC/SCT=0.7077, por
lo que en este caso el test de significancia global aplicando la fórmula 11.6 es (Gujarati, 2004: 250):
0.7077/(3−1) 0.3539
𝐹𝐹 = = = 73.84
(1−0.7077)/(64−3) 0.0048
En este caso nuevamente se rechaza la hipótesis nula, tanto al 5% como al 1%, dado que
𝐹𝐹0.05 (2, 60) = 3.15 y 𝐹𝐹0.01 (2, 60) = 4.98.
Ejemplo 3: Sin embargo, al igual que los casos anteriores, el test F también se puede implementar
siguiendo la técnica del p-value. En la Tabla 11.2 se observa un modelo con dos variables
explicativas, 𝑥𝑥1 y 𝑥𝑥2 . Desde el punto de vista de los coeficientes individuales, solo el coeficiente de
𝑥𝑥2 es significativo al 5% (p=0.024<0.05), al igual que la constante al 1%. La bondad de ajuste del
modelo es SEC/SCT=6.2629/6.4771=0.9669, como se desprende de la Tabla ANOVA y como
aparece confirmado en la segunda sub tabla.
Al analizar la Tabla ANOVA se observan los grados de libertad, y 𝑆𝑆𝑆𝑆𝑆𝑆/(𝑘𝑘 − 1) y 𝑆𝑆𝑆𝑆𝑆𝑆/(𝑛𝑛 − 𝑘𝑘).
Dado que el modelo estima 3 coeficientes (k=3), los grados de libertad del numerador son 2, y los
del denominador son 7-3=4. Entonces 6.2629/(3 − 1) = 3.1315 y 0.2142/(7 − 3) = 0.05355, por
lo que el estadístico F es igual a 3.1315/0.05355=58.47. Si bien este resultado se desprende del
análisis ANOVA, también aparece en la segunda sub tabla bajo la denominación F(2, 4)=58.47, y
debajo de ese valor aparece el p-value para el caso del F (ver Prob>F). En este caso, se rechaza la
hipótesis nula al 1% (p=0.0011<0.01), por lo que se rechaza la hipótesis de que todos los
coeficientes son simultáneamente cero.
Tabla 11.2. Modelo de Regresión.

reg y x1 x2

-------------+------------------------------ F( 2, 4) = 58.47
Model | 6.26291845 2 3.13145923 Prob > F = 0.0011
-------------+------------------------------ Adj R-squared = 0.9504
Total | 6.47714226 6 1.07952371 Root MSE = .23142
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | .0094754 .0094717 1.00 0.374 -.0168222 .0357729
x2 | -.3098176 .0869929 -3.56 0.024 -.5513486 -.0682866
_cons | 6.243757 .9390002 6.65 0.003 3.636675 8.85084
------------------------------------------------------------------------------
91
11.4. Otras formas funcionales.
En esta sección se revisan algunas de las formas funcionales que se usan en la estimación empírica.
Tal como se dijo en la introducción de la sección anterior, esta exposición no pretende ser
totalmente acabada, si no que una exposición a algunos de los temas generales del análisis de
regresión. De esta forma esta sub sección revisa algunas de las formas funcionales usadas en el
trabajo empírico.
A) Formas cuadráticas.
El análisis econométrico es bastante flexible por lo que también se pueden estimar funciones no
lineales. Recuerde las funciones cuadráticas de la sección “funciones”. En Microeconomía abundan
ejemplos de no linealidades, tales como los rendimientos marginales decrecientes de la utilidad o la
productividad marginal de los factores. Obsérvese la ecuación 11.7, en esta la variable Y depende no
solo de 𝑋𝑋1 sino que también de 𝑋𝑋12 .
2
𝑌𝑌𝑖𝑖 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋𝑖𝑖1 + 𝛽𝛽2 𝑋𝑋𝑖𝑖1 + 𝜀𝜀𝑖𝑖 (11.7)
La intuición de dicha ecuación se puede analizar recordando el Ejemplo 1 de la sección

“Aplicaciones de la Derivada” (sección 3.8.1). En este se presenta la ecuación 𝑦𝑦 = 2 + 𝑥𝑥 − 𝑥𝑥 2 , y la
figura correlativa corresponde a la Figura 11.1. Si se estima la ecuación 11.7 un resultado particular
podría ser la ecuación 𝑦𝑦 = 2 + 𝑥𝑥 − 𝑥𝑥 2 , donde 𝛽𝛽𝑜𝑜 = 2, 𝛽𝛽1 = 1 y 𝛽𝛽2 = −1. En sentido, con formas
cuadráticas es posible estimar funciones que tienen rendimientos decrecientes al factor.
Figura 11.1: Curva de Producción de un Organismo Público

y A
y’=0
B) Elasticidades.
El modelo MCO se puede estimar efectuando todo tipo de transformaciones sobre las variables. En
este sentido, al aplicar logaritmo natural sobre estas se tiene:
𝑌𝑌𝑖𝑖 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 + 𝜀𝜀𝑖𝑖 (11.8)
𝑌𝑌𝑖𝑖∗ = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋𝑖𝑖∗ + 𝜀𝜀𝑖𝑖 (11.9)
Donde 𝑌𝑌𝑖𝑖∗ = ln(𝑌𝑌𝑖𝑖 ) y 𝑋𝑋𝑖𝑖∗ = ln(𝑋𝑋𝑖𝑖 ). La estimación del modelo 11.9 cambia la interpretación del
coeficiente 𝛽𝛽1 , pues ya no corresponde al cambio en Y cuando X varía en una unidad, ahora
corresponde a la elasticidad. Es decir, corresponde al cambio porcentual en la variable Y cuando la
variable X aumenta en un 1%. Por ejemplo si 𝛽𝛽1 = 0.3 en 11.9, quiere decir que Y aumenta en
0.3% cuando X aumenta en 1%. Para aplicaciones particulares de este concepto se puede consultar
la “Elasticidad-Precio de la Demanda” en Frank (2005: 114).
92
Sin embargo, si bien el cálculo de la elasticidad requiere que las dos variables estén en logaritmo,
también hay otros modelos alternativos, en los cuales solo una variable se deja en logaritmo natural
y la otra en niveles, tales como el caso del modelo Log-Lin (11.10) y Lin-Log (11.11). Para el caso
del primero 𝛽𝛽1 corresponde a la tasa de crecimiento de Y producto de un aumento de una unidad en
X. Para el caso del segundo, 𝛽𝛽1 corresponde al cambio de unidades en Y, producto del aumento de
un 1% de X.
𝑌𝑌𝑖𝑖∗ = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 + 𝜀𝜀𝑖𝑖 (11.10)
𝑌𝑌𝑖𝑖 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋𝑖𝑖∗ + 𝜀𝜀𝑖𝑖 (11.11)
El modelo 11.10 es útil para calcular las tasas de crecimiento. En la tabla 11.3 se ha llevado a cabo
la estimación entre el logaritmo natural de Y y X en niveles. En este caso lny corresponde al
logaritmo natural del PIB per cápita y la variable year a los años, por lo que el coeficiente estimado
implica que la tasa anual de crecimiento del PIB per cápita es de 9.6%.
Tabla 11.3. Modelo de Regresión Log-Lineal.

reg lny year

-------------+------------------------------ F( 1, 5) = 76.47
Model | .259568698 1 .259568698 Prob > F = 0.0003
-------------+------------------------------ Adj R-squared = 0.9264
Total | .276540237 6 .046090039 Root MSE = .05826
------------------------------------------------------------------------------
lny | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
year | .0962825 .0110102 8.74 0.000 .0679797 .1245852
_cons | 1.154592 .0492393 23.45 0.000 1.028019 1.281166
------------------------------------------------------------------------------
C) Funciones de Producción.
En el ámbito de la economía es usual estimar funciones de producción, y una revisión de la teoría

indica que esta se puede modelar a través de diferentes formas, entre las que se tiene la función de
Leontief o de proporciones fijas, Sustitución Perfecta, y la Cobb-Douglas. Para una revisión de sus
características ver la teoría de la producción en Frank (2005: 300).
C.1) Función de Producción de Sustitución Perfecta: esta función se caracteriza por el supuesto de
que los insumos de producción son sustitutos perfectos, por lo que se podría sustituir trabajo (L) y
capital (K) sin problema, manteniendo la producción constante (Q). De esta forma, una función de
producción con tales características tendría la forma:
𝑄𝑄 = 𝛼𝛼𝛼𝛼 + 𝛽𝛽𝛽𝛽 (11.12)
Donde Q corresponde a la producción, K al capital, L al trabajo, y, α y β a los parámetros a estimar,

que en este caso deben ser positivos. Un ejemplo de esta función se puede observar en 11.13, donde
𝛼𝛼 = 2 y 𝛽𝛽 = 1, mientras que su forma gráfica se observa en la figura 11.2.
𝑄𝑄 = 2𝐾𝐾 + 𝐿𝐿 (11.13)
93
Figura 11.2: Función de Producción de Sustitutos Perfectos.
Dos Perspectivas.
L+2*K
L+2*K
30 30
25
25
20
20
z 15
15
z
10
10
5
5 10
8 010
10
0 6 8
0 8
2 4 K 6 6
4 4
6 2 K 4
8 2 L
L 2
10 0 0 0
C.2) Función de Producción Cobb-Douglas: esta función de producción es una de las más
utilizadas en la modelación de la producción tanto por su facilidad como por su versatilidad.
Formalmente esta define en la ecuación 11.14 (Frank, 2005: 300).
𝑄𝑄 = 𝑚𝑚𝑚𝑚 𝛼𝛼 𝐿𝐿𝛽𝛽 (11.14)
Donde 0 < 𝛼𝛼 < 1 y 0 < 𝛽𝛽 < 1, y 𝑚𝑚 > 0. En ese caso los valores a estimar corresponden a 𝛼𝛼, 𝛽𝛽 y
𝑚𝑚. Ejemplos de esta función se encuentran en las ecuaciones 11.15 a 11.17. En 11.15 𝛼𝛼 = 0.5,
𝛽𝛽 = 0.5 y 𝑚𝑚 = 1; en 11.16 𝛼𝛼 = 1, 𝛽𝛽 = 1 y 𝑚𝑚 = 1; mientras que en 11.17, 𝛼𝛼 = 2, 𝛽𝛽 = 1 y 𝑚𝑚 = 1.
𝑄𝑄 = √𝐾𝐾𝐾𝐾 (11.15)
𝑄𝑄 = 𝐾𝐾𝐾𝐾 (11.16)
𝑄𝑄 = 𝐾𝐾 2 𝐿𝐿 (11.17)
La gráfica de estas funciones se encuentra en la Figura 11.3.
Figura 11.3: Función de Producción Cobb-Douglas, Diferentes Parámetros.
(a) Ecuación 11.15.

sqrt(K*L)
sqrt(K*L)
10
10
8 8
6 6
z
4
4 z
2
2 10
010 10
8
0 6 8 8
0
2 4 K 6 6
4
6 2 4 4
L 8 K L
10 0 2 2
0 0
94
(b) Ecuación 11.16.
K*L
K*L
100
100
80
80
60 60
z
40 z 40
20 20
10 010 10
0
0 8
2 4 4 6 8 8
L 6 2 K 6
8 10 0 6
4 4 L
K 2 2
0 0
(c) Ecuación 11.17.

K^2*L
K^2*L
1000
800 1000
800
600
z 600
400 400
z
200
200
0
10 10
10
8 8 8
00 6
2 4 4 K
L 6 8 2 6 6
10 0
4 4
K L
2 2
0 0
Cabe destacar que la función Cobb-Douglas se puede transformar para facilitar su estimación.
Aplicando logaritmo natural sobre la ecuación 11.14, se tiene:
𝑄𝑄 = 𝑚𝑚𝑚𝑚 𝛼𝛼 𝐿𝐿𝛽𝛽
𝑙𝑙𝑙𝑙(𝑄𝑄) = 𝑙𝑙𝑙𝑙�𝑚𝑚𝑚𝑚 𝛼𝛼 𝐿𝐿𝛽𝛽 �
𝑙𝑙𝑙𝑙(𝑄𝑄) = 𝑙𝑙𝑙𝑙(𝑚𝑚) + 𝑙𝑙𝑙𝑙(𝐾𝐾 𝛼𝛼 ) + 𝑙𝑙𝑙𝑙(𝐿𝐿𝛽𝛽 )
𝑙𝑙𝑙𝑙(𝑄𝑄) = 𝑙𝑙𝑙𝑙(𝑚𝑚) + 𝛼𝛼𝛼𝛼𝛼𝛼(𝐾𝐾) + 𝛽𝛽𝛽𝛽𝛽𝛽(𝐿𝐿) + 𝜀𝜀 (11.18)
Por lo que el problema se limita a estimar los coeficientes 𝛼𝛼 y 𝛽𝛽 en la ecuación 11.18. Como se
puede observar, el MCO es bastante flexible y se puede utilizar para estimar un sinfín de formas
funcionales entre las variables en diferentes contextos de investigación.
Referencias.
Frank, Robert (2005). “Microeconomía y Conducta”. 5ta Edición. Mc Graw Hill. España


95
7. Suponga que tiene los siguientes datos, y se le pide que modele la calificación de los
alumnos en establecimientos de vulnerabilidad. Las variables son:
X= Tiempo que dedican a estudiar los alumnos de colegios en vulnerabilidad a estudiar en

minutos.
Y= Calificación del alumno.
Tabla 1
X Y
60 5
45 4.5
30 4
60 5.5
20 3.5
10 3
120 6
a. En STATA, obtenga la estadística descriptiva de cada variable (i.e. sum x)

b. Realice una inspección visual para explorar respecto de una potencial relación
(scatter x y).
c. Realice la modelación respectiva y calcule el R2 con la información de la suma de
cuadrados que ofrece el output de STATA.
d. Interprete los coeficientes estimados, y sus test de significancia (t y F) mediante el
criterio del p-valor.
e. Visualice la recta de regresión estimada usando el comando aaplot. Para instalar
digite en el cuadro de comandos: ssc inst aaplot
f. Nuevamente estime el modelo y haga una predicción del error usando el comando
predict r, resid.
g. Analice la normalidad de los residuos a través del test swilk. Dicho test asume
como hipótesis nula que los datos se distribuyen normalmente ¿Qué quiere decir el
resultado?
h. Confirme lo anterior a través de la estadística descriptiva en detalle de los residuos
(i.e. sum x, detail)
i. Estime nuevamente el modelo y haga una predicción de la variable Y, esto es Yˆ .
Luego correlacione Y e 𝑌𝑌�, y obtenga el cuadrado de la correlación ¿qué valor
obtuvo?
j. Ahora, estime el modelo en logaritmos naturales, e interprete el coeficiente
obtenido.
8. Usted dispone de la base de datos “muestra_casen2009” (donde la unidad de observación

son las personas). Se le pide que:
a. Realice una descripción de la base de datos (describe)

b. Determine cuantos casos corresponden a cada región usando el comando tab.
c. Determine cuantos casos corresponden a la zona urbana (tab)
d. Haga un estudio descriptivo de la variable ingreso autonómo usando el comando
summarize.
96
e. Haga el mismo estudio descriptivo, pero ahora solicite los detalles (sum x, detail)
f. Haga un estudio descriptivo del ingreso por zona, sexo, y estado civil. Utilice el
comando bysort (i.e. bysort z: sum yautaj)
g. Haga una inspección visual respecto del ingreso y la escolaridad utilizando el
comando scatter.
h. Realice la misma inspección visual, pero restringiendo el ingreso a un millón de
pesos.
i. Realice una matriz de correlaciones para las siguientes variables que pueden estar
correlacionadas con el ingreso: escolaridad y edad. Obtenga las correlaciones con
su significancia usando el comando pwcorr x, sig
j. Estime un modelo donde el ingreso es función de la edad y la escolaridad, e
interprete los coeficientes obtenidos.
𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 = 𝑓𝑓(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒, 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒)
k. Dado el bajo poder explicativo de la regresión anterior, debe estimar un nuevo

modelo donde el ingreso es función de:
𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 = 𝑓𝑓(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒, 𝑒𝑒𝑒𝑒𝑒𝑒𝑑𝑑 2 , 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒, 𝑅𝑅𝑅𝑅, 𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻, 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆, 𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂)
Donde las variables en mayúscula corresponden a variables dicótomas, las que

toman el valor de “uno” cuando se cumple la condición, y “cero” en otro caso.
Para crear las variables dicótomas analice cada variable mediante su codebook.
gen rm=(r==13)
gen HOMBRE=(sexo==1)
gen SANTIAGO=(comu==13101)
gen OCUPADO=(activ==1)
l. Estime nuevamente el modelo propuesto restringiendo el ingreso a una cifra menor

a un millón de pesos.
m. Por último, estime el coeficiente de Gini del ingreso, usando el comando ineqdeco.
97

Ormeo Elementos Cuantitativos 22dic2016 Online

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ormeo Elementos Cuantitativos 22dic2016 Online

Cargado por

Copyright:

Formatos disponibles

Elementos Cuantitativos de

Investigación en las Ciencias Sociales.

Héctor Ormeño Campos

1. Dimensión cuantitativa de los fenómenos sociales..................................................................................... 5

2. Dimensión cuantitativa en los órganos del sector público.

3. Las matemáticas necesarias.

Cancelación de factores comunes.

Ejemplos: A continuación se revisan algunos ejemplos de operaciones con fracciones (Budnick,

5 3 100+24 124 4𝑥𝑥31 31

3 5 18𝑥𝑥 2 −20𝑥𝑥 9𝑥𝑥−10

3(𝑥𝑥+1)−5𝑥𝑥(𝑥𝑥−1) 𝑥𝑥 2 3(𝑥𝑥+1)−5𝑥𝑥(𝑥𝑥−1)+𝑥𝑥 2 3𝑥𝑥+3−5𝑥𝑥 2 +5𝑥𝑥+𝑥𝑥 2

−4𝑥𝑥 2 +8𝑥𝑥+3 −4𝑥𝑥 2 +8𝑥𝑥+3

𝑥𝑥−1 15 (𝑥𝑥−1)15 (𝑥𝑥−1)3 3

Donde a corresponde a la base y m al exponente, esto es, en 23, 2 es la base, 3 el exponente, y el

𝑎𝑎𝑚𝑚 𝑎𝑎𝑛𝑛 = 𝑎𝑎𝑚𝑚+𝑛𝑛

(𝑎𝑎𝑚𝑚 )𝑛𝑛 = 𝑎𝑎𝑚𝑚𝑚𝑚

3.3. Exponentes Fraccionarios.

Donde n es un entero positivo, m un entero distinto de cero y a un número real.

Ejemplos de exponentes: A continuación se presentan algunos ejemplos de exponentes y exponentes

3.4. Operaciones algebraicas.

𝑎𝑎𝑎𝑎 + 𝑏𝑏𝑏𝑏 = 𝑥𝑥(𝑎𝑎 + 𝑏𝑏)

𝑎𝑎𝑎𝑎 − 𝑏𝑏𝑏𝑏 = 𝑧𝑧(𝑎𝑎 − 𝑏𝑏)

𝑎𝑎(𝑥𝑥 + 𝑦𝑦) = 𝑎𝑎𝑎𝑎 + 𝑎𝑎𝑎𝑎

(𝑎𝑎 + 𝑏𝑏)(𝑥𝑥 + 𝑦𝑦) = 𝑎𝑎𝑎𝑎 + 𝑎𝑎𝑎𝑎 + 𝑏𝑏𝑏𝑏 + 𝑏𝑏𝑏𝑏

La multiplicación de expresiones nos permite considerar ciertos productos frecuentes, denominados

(𝑥𝑥 − 𝑎𝑎)(𝑥𝑥 − 𝑎𝑎) = 𝑥𝑥 2 − 2𝑎𝑎𝑎𝑎 + 𝑎𝑎2 (Binomio diferencia al cuadrado)

(𝑥𝑥 + 𝑎𝑎)(𝑥𝑥 − 𝑎𝑎) = 𝑥𝑥 2 − 𝑎𝑎2 (Suma por la diferencia)

(𝑥𝑥 + 𝑎𝑎)3 = 𝑥𝑥 3 + 3𝑥𝑥 2 𝑎𝑎 + 3𝑥𝑥𝑎𝑎2 + 𝑎𝑎3 (Binomio suma al cubo)

(𝑎𝑎 − 𝑏𝑏)3 = 𝑎𝑎3 − 3𝑎𝑎2 𝑏𝑏 + 3𝑎𝑎𝑏𝑏 2 − 𝑏𝑏 3 (Binomio diferencia al cubo)

𝑎𝑎3 + 𝑏𝑏 3 = (𝑎𝑎 + 𝑏𝑏)(𝑎𝑎2 − 𝑎𝑎𝑎𝑎 + 𝑏𝑏 2 ) (Suma de cubos)

𝑎𝑎3 − 𝑏𝑏 3 = (𝑎𝑎 − 𝑏𝑏)(𝑎𝑎2 + 𝑎𝑎𝑎𝑎 + 𝑏𝑏 2 ) (Diferencia de cubos)

𝑎𝑎4 − 𝑏𝑏 4 = (𝑎𝑎2 − 𝑏𝑏 2 )(𝑎𝑎2 + 𝑏𝑏 2 ) = (𝑎𝑎 − 𝑏𝑏)(𝑎𝑎 + 𝑏𝑏)(𝑎𝑎2 + 𝑏𝑏 2 )

𝑎𝑎5 + 𝑏𝑏 5 = (𝑎𝑎 + 𝑏𝑏)(𝑎𝑎4 − 𝑎𝑎3 𝑏𝑏 + 𝑎𝑎2 𝑏𝑏 2 − 𝑎𝑎𝑏𝑏 3 + 𝑏𝑏 4 )

𝑎𝑎4 + 𝑏𝑏 4 = (𝑎𝑎2 + √2𝑎𝑎𝑎𝑎 + 𝑏𝑏 2 )(𝑎𝑎2 − √2𝑎𝑎𝑎𝑎 + 𝑏𝑏 2 )

La división de expresiones se puede ejemplificar a través del siguiente ejercicio, donde 𝑐𝑐 ≠ 0.

Sin embargo, en la realidad pueden existir divisiones de mayor complejidad. Supongamos, de

(2𝑥𝑥 3 − 11𝑥𝑥 2 + 0𝑥𝑥 + 23) ÷ (2𝑥𝑥 − 3)

�2𝑥𝑥 3 −11𝑥𝑥 2 +0𝑥𝑥+23� 5

Ejemplo 1: Suponga la siguiente expresión, 𝑥𝑥 2 − 2. Una forma de factorizar dicha expresión es la

𝑥𝑥 2 − 2 = 𝑥𝑥 2 − √22 = �𝑥𝑥 − √2�(𝑥𝑥 + √2)

Ejemplo 2: Es usual encontrarse con expresiones como la siguiente, en la cual la factorización es

𝑥𝑥 2 + 3𝑥𝑥 + 2 = (𝑥𝑥 + 1)(𝑥𝑥 + 2)

a. Principio de adición: se puede sumar o restar cualquier constante o expresión algebraica

3.6.1. Ecuaciones lineales.

La forma estándar de una ecuación lineal corresponde a (Arya et al, 2009):

Donde 𝑎𝑎 = 2 y 𝑏𝑏 = 3, por lo que la solución de la ecuación es 𝑥𝑥 = −3/2 . Más adelante se

3.6.2. Ecuaciones Cuadráticas.

La forma estándar de una ecuación cuadrática corresponde a (Arya et al, 2009):

𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐 = 0 (3.6)

𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐 = 0 con 𝑎𝑎 ≠ 0

Entonces, las raíces se obtienen de la ecuación (3.7).

Por ejemplo, para la ecuación anterior, la solución se obtiene:

3.6.3. Sistemas de Ecuaciones.

La primera ecuación implica que x=3-y, por lo que reemplazando en la segunda:

Lo que implica que y=2 y x=1.

A continuación se muestra la resolución del sistema.

Dado que se tiene el valor de P expresado en parámetros, se puede obtener el valor de y

Dado que y=110, entonces x es igual a 45.

3.7.1. Funciones Lineales.

Figura 3.1: Función lineal.

𝑅𝑅𝑅𝑅 = 1 + 0.3𝐸𝐸𝐸𝐸𝐸𝐸 (3.8)

𝑅𝑅𝑅𝑅 = 1.27 + 0.3𝐸𝐸𝐸𝐸𝐸𝐸 (3.9)

Gráficamente, lo que se produce es que aumenta el intercepto, desplazándose la función de forma