Está en la página 1de 2

FACULTAD DE INGENIERIA

ESCUELA DE ESTADÍSTICA
TAREA DE PROCESAMIENTO EN R
DOCENTE: JENNYFER PORTILLA YELA

GRUPO: 2 PERSONAS
FECHA DE ENTREGA: 1 MAYO 2018

Entregables: Campus virtual.


Archivo de respaldo:Código en R, Informe escrito en LaTex.

La base de datos adjunta contiene información acerca de algunas de las caracterı́sticas de la recolección de desechos
sólidos en la ciudad de Santiago el Cali. El objetivo de este estudio consistió en caracterizar las basuras en cuanto a
su cantidad y composición, al igual que caracterizar las rutas de recolección y los hogares que generan los residuos
en cuanto a su nivel de sensibilización respecto al manejo de residuos. (Cada registro corresponde a la información
recabada sobre cada una de las familias encuestadas, siendo posible que dentro de una misma unidad de vivienda se
presentaran 2 o mas familias).

Como podrán observar el registro de datos está compuesto por algunas variables de caracterización del hogar y
ubicación del mismo, tales como:

Barrio, Comuna, Estrato Socioeconómico, Presencia de servicios Públicos (Energı́a, Teléfono, Agua, Gas,
Alcantarillado, Aseo) y si separan o no las basuras generadas. Posteriormente se encuentran algunas variables de
composición del hogar, tales como; número de familias por vivienda, total de personas por vivienda, total de personas
por familia, No personas por familia con titulo (universitario, técnicos, secundaria, primaria, sin información sobre su
educación) y numero de personas que laboran. Paso seguido encontraran un conjunto de variables de caracterización
de los desechos, especı́ficamente se pregunta si en los desechos recogidos se encontraron residuos de (Plástico, Papel
y Cartón, Vidrio, Metal, y otro) “Como podrán observar, por alguna razón ajena al grupo de investigadores, los
recicladores encargados de revisar los desechos no revisaron la totalidad de muestras de basuras, por tanto algunos
registros tendrán todas estas variables en blanco”. Posteriormente encontraran una variable que mide el recipiente
que utilizan para depositar la basura, entre ellos encontraran: Canecas, Bolsas, Caneca-Bolsa (una caneca con una
bolsa interior). El siguiente par de variables determinan si las personas saben que es reciclaje (1= conocen reciclaje,
2= desconocen el reciclaje) y si efectivamente lo practican (1= lo practican, 2= no lo practican) y dos variables que
miden el peso en kilogramos de las basuras recogidas durante dos dı́as en una semana.

Pautas para el análisis:

1. Seguramente si sumáramos el número de personas con cada nivel de educación, incluyendo la categorı́a sin
información, este deberı́a ser igual al número de personas por familia. De igual manera el número de personas
por vivienda siempre será mayor o igual al número de personas por familia, lo mismo sucederı́a con el número
de personas que laboran en una familia. Su primer paso es validar estas condiciones, identificando en la base de
datos los registros con inconsistencias.

2. Situémonos en las variables (Recicla; Sabe que es reciclaje y Recicla Viv; Efectivamente recicla), note que la
combinación (0,1) de este par de variables es imposible, (como una familia que no sabe que es reciclaje lo puede
estar ejerciendo?) valore este tipo de inconsistencias en el registro de datos, documente y corrija la situación.

3. Analice el contexto de las variables e intente identificar qué tipo de inconsistencias serian inadmisibles y
corregibles en la base de datos, e idee algún procedimiento de identificación.

4. Como nuestro interés es encontrar la cantidad de desechos generados por cada familia en una semana, deberán
generar desde otra variable que consolide el peso de ambas muestras, pero previamente deben identificar mediante
funciones de R, aquellos hogares que no suministraron la información de ambas muestras, y consolidar el peso
total en kilogramos de la basura recogida (Tomando la precaución de sumar solamente las familias que contienen
información en ambas mediciones).
5. Recodifique la variable estrato socioeconómico de la siguiente manera:

Bajo =1,2 Medio =3,4 Alto=5,6

6. De una idea de cómo está conformada la muestra por comuna, estrato codificado y franja generando la
distribución de frecuencias absolutas y relativas de estas caracterı́sticas. Genere gráficos que resuman la
información depositada en estas tablas.

7. Evalué el porcentaje de hogares que disponen de servicios públicos (Agua, energı́a, teléfono,etc..) para la familias
encuestadas. Genere un único gráfico de barras que resuma esta caracterı́stica.

8. Construya y grafique la distribución de frecuencias del número de habitantes por hogar y el peso conjunto de las
dos recolecciones (Boxplot). De la mima manera calcule los estadı́sticos descriptivos de este par de caracterı́sticas
(media, mediana, moda, percentiles, desviación, coeficiente de variación, asimetrı́a, kurtosis) y analice.

9. En un procedimiento similar al que realizo en el punto 7, calcule el porcentaje de hogares que dentro de sus
basuras presentan compuestos de metal, vidrio, plástico, etc. Genere un gráfico adecuado.

10. Realice un análisis similar al realizado en los puntos 7 al 9, pero esta vez realice el análisis y gráficos por estrato
codificado y por zona de recolección.

11. Analizar e interpretar la existencia de relación entre el peso de la basura generada por semana y el número de
personas por familia, a través de un gráfico de dispersión.

12. Construya una nueva variable que mida la producción de basura per capita por semana, denomı́nela PPC. Esta
variable representa una estimación de cuanta basura genera cada integrante de la familia por semana. Analice
esta variable (mediante la comparación de estadı́sticas resumen) para cada estrato socio económico (codificado),
al igual que para cada zona de recolección. ¿Los resultados sugieren diferencias en la producción de basuras por
cada sub-población?

Observaciones importantes

Construya un informe lo suficientemente sintético que ilustre de la mejor manera los resultados obtenidos. Intente
dirigir su informe siguiendo las pautas mostradas. Su informe no debe superar 8 páginas. Los indicadores estadı́sticos
no deben ser interpretados 1 por 1, por el contrario se realiza una interpretación conjunta de los mismos sin perder
de vista el objetivo del estudio.

“Odie cada minuto de entrenamiento. Pero me dije: No abandones. Sufre ahora y vive el resto de tu vida como el
campeón”

También podría gustarte