Está en la página 1de 8

Análisis Cuantitativo y de Datos

Taller 1
Fecha de entrega: 9 de marzo, 2020

La entrega final del taller tiene que venir en formato word o PDF, es decir debe ser escrita como un
documento. No basta con copiar y pegar los resultados de Stata, deben explicar con palabras cada uno de
esos resultados. La entrega debe hacerse a través del aula virtual antes de iniciar la clase. Adicionalmente,
deben incluir en la entrega el do-file con los comandos que utilizaron (el nombre del archivo debe ser “Apel-
lidos T1.do”). Debe ser posible ejecutar el código sin ningún error. Por favor anote en su documento el
nombre de todos los integrantes del grupo, e informe si accedió a otros estudiantes o a recursos electrónicos
para solucionar el taller.
Todos los archivos requeridos para completar el taller se encuentran en la página del curso. La entrega
tarde del taller se regirá por lo establecido en el programa del curso.

La siguiente es la escala de evaluación del taller.

Table 1: Escala de evaluación Taller


Sección o tema Porcentaje de la nota
Pregunta 1.1 1%
Pregunta 1.2 1%
Pregunta 1.3 1%
Pregunta 1.4 1%
Pregunta 1.5 10 %
Pregunta 1.6 10 %
Pregunta 2.1 1%
Pregunta 2.2 10 %
Pregunta 2.3 5%
Pregunta 3.1 5%
Pregunta 3.2 5%
Pregunta 3.3 10 %
Pregunta 4.1 5%
Pregunta 4.2 5%
Pregunta 4.3 5%
Pregunta 5.1 1%
Pregunta 5.2 1%
Pregunta 5.3 5%
Pregunta 5.4 10 %
Orden y claridad en presentación de resultados 4%
Código (do-file) corre sin errores 4%

1
1 Problema: Estadı́sticas descriptivas
Para esta sección deberá trabajar con una base de datos de internet con pruebas de estudiantes. Para abrir
la base de datos pueden ejecutar el comando:

use "http://www.philender.com/courses/data/hsb2"

1.1 Presente la distribución de frecuencia de las razas en la muestra (variable


race). Asegúrese de incluir la opción para tabular valores omitidos si existen
(1 punto).
1.2 Reporte las estadı́sticas descriptivas para la variable socst. Pegue sus re-
sultados y reporte la media, mediana, el valor mı́nimo, el valor máximo y
la desviación estandar en una frase (1 punto).
1.3 Presente un histograma para la variable socst (1 punto)
1.4 Presente un diagrama de caja para la variable socst (1 punto)
1.5 ¿Existen diferencias en los puntajes en las pruebas de humanidades (social
studies scores) entre hombres y mujeres de esta muestra? Argumente y
presente por lo menos una gráfica que ayude a justificar su argumento (10
puntos).
1.6 ¿Considera que los resultados en las pruebas de humanidades (social studies
scores) tienen validez convergente y discriminante? ¿Cree que podrı́a existir
un error en la medición? (10 puntos)

2
2 Problema: Estadı́sticas descriptivas 2
Para esta sección deberá trabajar con una base de datos guardada en el sistema. Abra la base de datos de
prueba que viene con Stata y se llama “auto2.dta”.

2.1 De un ejemplo de una variable intervalo, ordinal, categórica y dummy que


se encuentra en esta base de datos (1 punto).
2.2 ¿Cree que existen diferencias en el consumo de combustible (variable mpg)
o la longitud del carro (variable length) entre carros estadounidenses y
extranjeros? Argumente y presente los datos y gráficas que considere nece-
sarios (10 puntos).
2.3 Con base en su respuesta a la pregunta anterior, proponga una relación
causal entre dos variables existentes en esta base de datos. Identifique vari-
able dependiente e independiente y proponga una hipótesis para la relación
(5 puntos).

3
3 Problema: Probabilidad
Para esta sección no necesitarán Stata (excepto que lo quieran utilizar como calculadora). Prioricen el tiempo
en clase que tienen acceso seguro a los computadores.

3.1 Calcule la probabilidad de sacar cada uno de los siguientes:


Para esta sección tenga en cuenta que un naipe tradicional tiene 52 cartas, divididas en cuatro palos: picas
(♠), corazones (♥), tréboles (♣) y diamantes (♦) cada uno con 13 cartas S={A,2,3,4,5,6,7,8,9,10,J,Q,K}.
Las picas (♠) y tréboles (♣) son palos de color negro, los corazones (♥) y diamantes (♦) son palos de color
rojo.

3.1.1 Un 4 de diamantes (♦) (1 punto)

3.1.2 Una J (1 punto)

3.1.3 Un número primo (1 punto)

Un número primo es un un número natural mayor a 1 que se puede dividir solo por el mismo y el 1. Los
número primos del 1 al 52 son: 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43 y 47.

3.1.4 Un 4 o un número primo (1 punto)

3.1.5 Un corazón (♥) o un número primo (1 punto)

3.2 Calcule la probabilidad de sacar cada uno de los siguientes:


La directora de la Dian acaba de recibir la siguiente información con base en los últimos datos sobre el pago
de impuestos luego de aplicar el beneficio tributario para legalizar recursos en el exterior. Quiere calcular las
probabilidades con base en estos datos para ver que tan útil podrı́a ser concentrar sus esfuerzos del próximo
año en perseguir a personas que están evadiendo impuestos.

Table 2: Contribuyentes con recursos en el exterior


Tipo de contribuyente Solicitó beneficio No solicitó beneficio Total
Persona natural regimen simple 22 70 92
Persona natural régimen común 13 40 53
Persona jurı́dica (pyme) 7 0 7
Persona jurı́ca gran contribuyente 146 45 191
Entidad sin ánimo de lucro 20 68 88
Total 208 223 431

4
3.2.1 ¿Cuál es la probabilidad que un contribuyente solicitara el beneficio? (1 punto)

3.2.2 ¿Cuál es la probabilidad que un gran contribuyente no haya solicitado el beneficio? (1


punto)

3.2.3 ¿Cuál es la probabilidad de ser una persona natural del régimen común y de solicitar
el beneficio? (1 punto)

3.2.4 ¿Cuál es la probabilidad de ser una una pyme o de no solicitar el beneficio? (1 punto)

3.2.5 ¿Cuál es la probabilidad de recibir el beneficio dado que se es una persona natural del
régimen simple? (1 punto)

3.3 Probabilidad de aprobar un proyecto en un OCAD


El alcalde de Puerto Gaitán (Meta) sabe que su municipio es uno de los municipios que más recursos recibe
por regalı́as. En su experiencia en años anteriores sabe que las probabilidades de que le aprueben un proyecto
de regalias en el OCAD sin objeciones es de 0.50. El está convencido que la decisión de que le aprueben cada
proyecto es independiente.

3.3.1 Presente un árbol de probabilidad para mostrarle al alcalde la probabilidad de presentar


tres proyectos al OCAD (4 puntos)

3.3.2 ¿Cuál es la probabilidad de que ningún proyecto sea aprobado? (2 puntos)

3.3.3 ¿Cuál es la probabilidad de que exactamente un proyecto sea aprobado? (2 puntos)

3.3.4 ¿Cuál es la probabilidad de que exactamente dos o más proyectos sean aprobados (2
puntos)?

5
4 Problema: Distribuciones
Para el problema 2 de esta sección deben utilizar Stata. Los otros problemas no requieren Stata, pues pueden
resolverlos con una tabla de probabilidad para la distribución normal. Sin embargo si quieren también pueden
calcular las probabilidades de valores relacionadas con valores z utilizando el comando di normal(z).

4.1 Examen de Cancillerı́a (5 puntos)


Cancillerı́a utiliza un examen para calificar a los candidatos que quieren ingresar al servicio diplomático. De
acuerdo a las reglas de ingreso para recibir la oferta de ingresar al servicio el candidato debe estár entre el
5 % superior de su cohorte. Este año los resultados del examen tienen una distribución normal, una media
de 58 y una desviación estándar de 18. ¿Cual es el puntaje mı́nimo que tiene que tener un candidato para
recibir una oferta?

4.2 Talla en centı́metros de recién nacidos en Bogotá en 2017


Para esta sección utilizarán la base de datos nac2017 bog.1

4.2.1 Presenten un histograma de la talla en centı́metros de los recién nacidos en Bogotá en


2017. ¿Qué tipo de distribución tiene esta variable? (1 puntos)

4.2.2 Calculen la media y la desviación estándar para la talla en centı́metros de los recién
nacidos en Bogotá en 2017. (1 puntos)

4.2.3 ¿Cuál es la probabilidad que tenga una talla menor a 20 cm para nuestra muestra? (3
puntos)

4.3 Lanzamiento de dados


4.3.1 Se lanza un dado 4 veces. Determine la probabilidad de sacar dos unos ( ) sin utilizar
Stata (presente sus cálculos) (4 puntos)

Pista: Piensen en que esto podrı́a ser un experimento con una distribución binomial, donde el éxito es igual
a sacar 1 ( ) y el fracaso es sacar cualquier otro número. También tengan en cuenta que para este caso
pueden calcular el valor z de la probabilidad con:

r − (n · p)
z=p
n · p(1 − p)
Donde r es el número de exitos del experimento, p es la probabilidad de sacar un resultado y n es el número
de intentos.
1 Esta base de datos adapta la base de datos de nacimientos 2017 del DANE y simula para el caso de Bogotá la talla

de los recién nacidos con base en una aproximación a la desviación estándar y la media. ¡SOLO UTILIZAR PARA FINES
ACADÉMICOS LA INFORMACIÓN DE TALLA NO ES REAL!

6
4.3.2 Ahora calcule la probabilidad de sacar 37 unos ( ) en 358 intentos (utilizando Stata)
(1 punto)

7
5 Problema: Margen de error - Muestras de nacimientos en Bo-
gotá
Para este problema deben utilizar Stata y en particular las bases de datos muestra1 nac2017 bog, mues-
tra2 nac2017 bog, y nac2017 bog. Para una de las dos muestras pueden utilizar el comando de Stata para
construir el intervalo de confianza, pero para la otra tendrán que hacer los cálculos a mano.

5.1 Calculen la media y la desviación estándar para la talla en centı́metros de


los recién nacidos en Bogotá en 2017 para la muestra 1 y reporten el número
de observaciones de la muestra (1 punto)
5.2 Calculen la media y la desviación estándar para la talla en centı́metros de
los recién nacidos en Bogotá en 2017 para la muestra 2 y reporten el número
de observaciones de la muestra (1 punto)
5.3 Construyan un intervalo de confianza para cada X̄ que contenga µ con una
certeza del 95% (5 puntos)
5.4 Un asesor del Secretario de Salud alega que se debe utilizar la muestra
1 pues es más grande. Otro asesor del Secretario de Salud alega que la
muestra 2 es mejor aún con su tamaño reducido. El Secretario de Salud
sabe que ustedes son expertos en métodos cuantitativos (pues tomaron la
clase de Análisis Cuantitativos y de Datos) y les pide que le digan cuál
es la mejor muestra. Argumenten cuál es la mejor muestra (teniendo en
cuenta que saben que µ = 50.51) y expliquen cuál puede ser el problema de
la muestra que no eligieron. (10 puntos)

También podría gustarte