Está en la página 1de 1

UNIVERSIDAD DEL PACÍFICO

Facultad de Economía
130223 – Estadística Aplicada
Profesores: Walter Bazán / Alexandra Málaga / Juan Carlos Salinas
Semestre: 2022-2

CASO STATA
– TIEMPO: 120 MINUTOS –

1. (5 puntos) artículos.dta que contiene el título y la fuente de 1000 artículos y capitales.dta que contiene
los nombres y capitales de 190 países. Cree una base de datos de 190 mil observaciones donde cada
observación corresponda a un artículo – país. Es decir, cada artículo está repetido para los 190 países
y cada país está repetido para los 1000 artículos.

PISTA: Una manera de repetir las observaciones es utilizar el comando expand.


NOTA: Puede revisar ayuda1.dta como ejemplo de cómo debe quedar la base de datos.

2. (7 puntos) A partir de ayuda1.dta, cree una base de datos que cumpla los siguientes requisitos:

- La base solo contiene las variables: id del artículo, title, source y country.

- Para los artículos que contienen el nombre o capital de al menos un país, la base solo incluye
los países a los que el artículo está asociado.

NOTA: Tome en cuenta que capital se encuentra en blanco para algunos países.
PISTA: Revise el help de la función strpos().

- Para los artículos que no contienen el nombre o capital de ningún país, la base incluye una
única observación por artículo que pone “NA” en la variable country.

NOTA: Puede revisar ayuda2.dta como ejemplo de cómo debe quedar la base de datos.

Además, presente en una tabla la cantidad de artículos según el número de países asociados al
artículo. Indique cuántos artículos no están asociados a algún país en comentarios en el do-file.

3. (8 puntos) A partir de ayuda2.dta, presente en un gráfico la distribución de artículos según país para
cada fuente solo para aquellos países para los que estima que en total existen más de 1000 artículos
en el período analizado.

Para ello, tome en cuenta que la información en artículos.dta proviene de una muestra aleatoria
estratificada por fuente de un total de 24812 artículos de BBC, 10261 artículos de Associated Press
(APR), 6805 artículos de New York Times (NYT) y 992 artículos de The Economist (EC).

No olvide colocar títulos para que el gráfico se entienda por sí solo y que “NA” no es un país.

PISTA: Recuerde que el ponderador muestral es la inversa de la probabilidad de selección, donde la


probabilidad de selección es igual al número de observaciones en la muestra entre el número de
observaciones en la población a la cual la muestra representa.

También podría gustarte