Está en la página 1de 12

INVESTIGACIÓN CUANTITATIVA

21-1

Instrucciones generales:

- Por favor resalte de manera clara su respuesta. Por favor utilice letra en este
color azul
- Por favor genere un nombre de archivo así: GRUPO6
- Fecha de entrega: viernes 23 de abril después de la clase de investigació n
cuantitativa

I. Ley de los grandes números (La sección I. tiene una calificación de 0.75
en la nota del examen, por tanto, cada literal vale 0.1875)

La siguiente imagen ilustra el comportamiento de la funció n del nú mero de caras en


n lanzamientos de una moneda.

De acuerdo con esta informació n:

a. Explique en qué consiste la ley de los grandes nú meros


b. Exponga un ejemplo en el que se pueda ver este comportamiento
c. Justifique la importancia de este concepto para el aná lisis de estadística
inferencial
d. ¿Qué pasará cuando n=50000?
Solución:

a) La ley de los grandes números, también llamada ley del azar, afirma que al
repetir un experimento aleatorio un número de veces, la frecuencia relativa de
cada suceso elemental tiende a aproximarse a un número fijo, llamado
probabilidad de un suceso.
b) Veamos el siguiente ejemplo

Supongamos el siguiente experimento: lanzar un dado común. Ahora


consideremos el evento de que nos salga el número 1. Como sabemos, la
probabilidad de que salga el número 1 es de 1/6 (el dado tiene 6 caras, una de
ellas es el uno).

c) Cuando n=50000, se observa una mayor concentración alrededor de 0.5 y el


porcentaje de área correspondiente al intervalo 0.45 a 0.55 se hace mas
grande.

II. Teorema del límite central (La sección II. tiene una calificación de 0.75
en la nota del examen, por tanto, cada literal vale 0.1875)

En el siguiente grá fico, Theoharatos (2019) (material incluido en la carpeta del


examen) modela para tres tipos de muestra el comportamiento grá fico que ilustra el
Teorema del Límite Central (TLC)
3

De acuerdo con esta informació n:


a. Explique en qué consiste el Teorema del Límite Central
b. ¿Qué pasa con la media de la muestra a medida que aumenta el nú mero de
intentos?
c. Ejemplifique casos en los que se puede comprobar el TLC
d. ¿Qué dificultades se pueden presentar para utilizar el TLC?

Solución:
a) El teorema de limite central (TCL) es una teoría estadística que establece
que, dada una muestra aleatoria suficientemente grande de la población, la
distribución de la media muestrales seguirá una distribución normal.
b) A medida que el tamaño de la muestra n, se incrementa, la media muestral se
acerca a la media de la población. Por lo tanto, mediante el (TCL) podemos
definir la distribución de la media muestral de una determinada población con
varianza conocida. De manera que la distribución seguirá una distribución
normal si el tamaño de la muestra es lo suficientemente grande
X́−μ
Z=
σ /√n
Cuando n → ∞, es la distribución normal estándar.
c) Considere el siguiente ejemplo
Se desea analizar las rentabilidades medias históricas del índice S&P 500, que
como sabemos, tiene unas 500 compañías dentro del mismo. Pero no tenemos
suficiente información como para analizar la totalidad de las 500 compañías del
índice. En este caso la rentabilidad media del S&P 500 sería la media poblacional.

Ahora bien, siguiendo al TCL podemos coger una muestra de estas 500 empresas
para realizar el análisis. La única limitación que tenemos es que en la muestra tiene
que haber más de 30 compañías para que se cumpla el teorema. Entonces
imaginemos que cogemos 50 compañías del índice de manera aleatoria y repetimos
el proceso varias veces.

Los pasos para aplicar (TCL), serian

 Elegimos la muestra de unas 50 compañías y obtenemos la rentabilidad


media de la totalidad de la muestra.
 De manera continuada seguimos escogiendo 50 compañías y obtenemos la
rentabilidad media.
 La distribución de todas las rentabilidades medias de todas las muestras
escogidas se aproximará a una distribución normal.
 Las rentabilidades medias de todas las muestras seleccionadas se
aproximarán a la rentabilidad media del total del índice. Tal y como
demuestra el teorema Central del Límite.

Por tanto, mediante inferencia de la rentabilidad media de la muestra podemos


acercarnos a la rentabilidad media del índice.
III. Regresión Lineal Simple (La sección III. tiene una calificación de 0.75 en
la nota del examen, por tanto, cada literal vale 0.1875)

Morales (2009) en “Corrupció n y democracia: América Latina en perspectiva


comparada” (material incluido en la carpeta del examen) analiza la percepció n de
corrupció n y confianza ciudadana en la democracia en los países de América Latina.
Para ello, realiza un ejercicio econométrico con la encuesta LAPOP y el Índice de
percepció n de la corrupció n (CPI) para 20 países de América Latina.

De acuerdo con el grá fico:


a. ¿Qué podemos decir frente a la relació n entre la legitimidad y satisfacció n con
la democracia en los países latinoamericanos?
b. Plantee có mo sería la ecuació n estimada para calcular la línea de regresió n
(fitted values en la grá fica)
c. ¿Có mo analiza la dispersió n de la informació n sobre satisfacció n con la
democracia?
d. ¿Qué conclusiones preliminares podemos obtener de analizar el grá fico?

Solución:

a) Después de analizar el diagrama de dispersión de anterior, se deduce que


existe una relación lineal directa entre la legitimidad y satisfacción con la
democracia en los países latinoamericanos.
b) la ecuación estimada para calcular la línea de regresión, seria

^μY ∨X i= Y^ i= ^β 0 + ^β1 X i
i

El cual representa el valor promedio de la variable dependiente Y , para un


valor de la variable independiente X , es decir, en el i−´esimo individuo.
c) Se puede observar que hay una gran concentración en la nube de punto con
respecto a la recta ajustada sobre satisfacción con la democracia.

d) De acuerdo a la información en el grafico anterior, se puede concluir que hay


una relación directamente proporcional entre las dos variables dado que se
puede observar que a medida que la legitimidad aumenta la satisfacción
también aumenta.

IV. Regresión Lineal Múltiple (La sección IV. tiene una calificación de 0.75
en la nota del examen, por tanto, cada literal vale 0.15)

En su paper Pilster, U., & Bö hmelt, T. (2011). Coup-proofing and military


effectiveness in interstate wars, 1967–99 (material incluido en la carpeta del
examen), los autores analizan la influencia de las relaciones entre la sociedad civil y
las fuerzas armadas en la efectividad de los militares, analizando las cualidades de
liderazgo y habilidad de coordinació n de diferentes unidades militares como forma
de medir la capacidad de reacció n ante intentos de golpes de Estado. Los resultados
de la estimació n se presentan a continuació n:
De acuerdo con estos resultados:

a. Interprete los coeficientes de coup proofing, defender capability y atacker


democracy (Nota: recuerde analizar la significancia econó mica y estadística de los
coeficientes)
b. ¿Qué diferencias encuentra entre el modelo 1 y 2?
c. Con respecto a los resultados de los modelos 1 y 2, ¿qué aportan las estimaciones
del modelo 3?
d. En términos de creencias religiosas: interprete los coeficientes del modelo 2 y 3
e. En términos del R2 ¿Cuá l de los tres modelos explica má s la variació n en la
efectividad militar?

V. Ejercicio aplicado (La sección V tiene una calificación de dos unidades


en la nota del examen por lo que cada literal tiene un valor de 0.5)

Para la base de datos r7_merged_data_34ctry_release.dta


Instrucciones
1. Antes de iniciar el trabajo en STATA revisar en detalle las variables, el codebook
está incluido en la carpeta del examen
2. Una vez la base esté cargada en STATA hacer una vista (br) de la informació n
recordando que:
El color azul representa informació n guardada como nú mero, con una etiqueta
(label) en letras
El color rojo representa informació n guardada como letras (string)
El color negro representa informació n reconocida como nú meros

3. Usar el do-file para guardar la programació n realizada


4. Las tablas pueden ser copiadas de STATA siempre y cuando sean legibles en el
archivo de Word donde se está contestando el examen

Analizar la siguiente informació n:


a. ¿Cuá ntas observaciones tiene la base de datos? ¿Qué países son incluidos en la
muestra?
Solución:
a) La base de datos tiene 45823 observaciones
Ahora vemos los países que son incluidos en la muestra
b. Cuá les son los idiomas (q2bother) má s hablados en:
o Botswana
o Gambia
o Kenya
o Nigeria

Solució n:
b) Se muestra las primas y ultimas observaciones para los idiomas (q2bother) má s
hablados en los países anteriores
De donde se tiene que
los idiomas con mayor frecuencias para esos países son “adele, agnanga, aten,
baruba, bhojpuri, builsa, buja, bulo,dafing, djimi, djimini,frafa,gonja,gourmantche,
hausa,higgi,konkomba, kusaal.

c) ¿Qué podemos decir frente al nivel de corrupció n (q45)? Analice los países de la
muestra de la informació n (media, desviació n está ndar de las respuestas).
Solución:
De los anterior se puede decir que con mayores frecuencias el nivel de
corrupción (q45) es de 16,304 (increased a lot)

Ahora veamos para los países de la muestra de la información (media,


desviación estándar de las respuestas).

En consecuencia, el promedio es de 2.773673, la desviación estándar de


2.013484

d) Para la siguiente relació n, descrita en la ecuació n, analice la relació n entre


condiciones de vida y las siguientes variables:

CV =β 0 + β 1 EG + β 2 PP+ β 3 CG + β 4 CR+ β5 P+ β 6 Corrup+ β7 discrimin+ β 8 igualdad+ ϵ

CV: Las condiciones de vida con respecto a otros


EG: Equidad de Género
PP: Participació n política
CG: Contacto de la ciudadanía con el gobierno
CR: Contacto de la ciudadanía con líderes religiosos
P: Confianza en el presidente
Corrup: percepció n de la corrupció n en el país
Discrim: Si ha experimentado discriminació n por su identidad religiosa
Igualdad: Posibilidad igualitaria de hombres y mujeres para heredar

Variables para tener en cuenta: q5, q16, q22, q25c, q25f, q43a, q44e, q86b, q77d
Solució n:

Presente sus conclusiones de acuerdo con los coeficientes encontrados en la


regresión

Luego el modelo de regresión múltiple seria

´ =0.0424554 +0.0042094 EG+ 0.0230062 PP−0.0052665CG +0.0497618+0.01192324 P+ 0.0000


CV

De acuerdo a la salida que suministra STATA, de los coeficientes


encontrados en la regresión, se puede concluir que q 25 f (Contacto de la
ciudadanía con líderes religiosos), resulto no significativo en el modelo dado
que su p-valor> 0.05, mientras que , q16, q22, q25c,, q43a, q44e, q86b,
q77d, resultaron significativos en el modelo de regresión dado que su p-valor
<0.05

También podría gustarte