Está en la página 1de 23

PORTADA

II

DEDICATORIA
III

AGRADECIMIENTO
IV

RESUMEN
V

INDICE
1. Capítulo I Introducción............................................................................................................7

1.1. Base de datos.....................................................................................................................8

1.2. Población...........................................................................................................................8

1.3. Muestra..............................................................................................................................8

1.4. Imputación........................................................................................................................8

2. Capítulo II Estado del arte.......................................................................................................8

3. Capítulo III Planteamiento del problema.................................................................................9

1.1. Datos ausentes......................................................................................................................9

4. Capítulo IV Objetivos............................................................................................................10

4.1. Objetivo general..............................................................................................................10

4.1.1. Implementar un método de imputación para datos de caudales de ríos en chile.....10

4.2. Objetivos específicos......................................................................................................10

4.2.1. Estudiar de los métodos propuestos en la literatura.................................................10

4.2.2. Imputar datos en series temporales de caudales de ríos...........................................10

4.2.3. Evaluar los resultados del método implementado...................................................10

4.3. Hipótesis..........................................................................................................................10

5. Capítulo V Metodología........................................................................................................11

5.1. Método de imputación de datos......................................................................................11

5.1.1. Random Forest.........................................................................................................11


VI

5.2. Imputación de datos........................................................................................................11

5.2.1. Lo necesario.............................................................................................................11

5.3. Evaluación de resultados.................................................................................................11

5.3.1. Homogeneidad.........................................................................................................11

6. Capítulo VI Aplicación..........................................................................................................12

6.1. Recopilación de datos.....................................................................................................12

6.1.1. Base de datos original..............................................................................................12

6.2. Análisis exploratorio de los datos...................................................................................12

6.3. Organización de datos.....................................................................................................12

6.3.1. Bases de datos generadas.........................................................................................12

6.4. Imputación de base de datos...........................................................................................12

6.4.1. Datos fijos y aleatorios............................................................................................12

6.5. Imputación según bases de datos....................................................................................12

6.5.1. Población.................................................................................................................12

6.5.2. Muestra....................................................................................................................12

6.6. Comparación de la imputación........................................................................................12

6.6.1. Según escalas...........................................................................................................12

6.7. Resultado de la imputación.............................................................................................13

6.7.1. Homogeneidad.........................................................................................................13

7. Capítulo VII Resultados........................................................................................................13


VII

7.1. Análisis de imputación....................................................................................................13

7.1.1. Imputación única.....................................................................................................13

8. Capítulo VIII Conclusiones...................................................................................................13

9. Capítulo IX Bibliografía........................................................................................................13

10...................................................................................................................................................13

11. Capítulo II...........................................................................................................................14

11.1. Título nivel 2...............................................................................................................14

11.1.1. Título nivel 3........................................................................................................14

12. Capítulo III Tablas y Figuras..............................................................................................15

12.1. Tablas APA 7ma edición.............................................................................................15

12.2. Figuras APA 7ma edición...........................................................................................16

13. Capítulo IV Citas y Referencias.........................................................................................18

1.1.1.
VIII

INDICE DE TABLAS

Tabla 1 Datos faltantes según (widman 2006)................................................................................9

Tabla 1 El título debe ser claro y descriptivo...............................................................................15

Tabla 2 asdasdsadsadad................................................................................................................15

Tabla 3 El título debe ser claro y descriptivo...............................................................................16


IX

INDICE DE FIGURAS

Figura 1 el titulo debe ser breve y conciso...................................................................................12

Figura 2 xxxxxxxxxxxxxxxxx......................................................................................................13
7

1. Capítulo I

Introducción

En Chile, las mediciones de caudal están incompletas y corresponden a series temporales, la

ausencia de datos se debe principalmente a eventos extremos de precipitación, falta de

mantención o robo de instrumental y responde al hecho de ser mediciones temporales, realizadas

con instrumental in situ (A. Córdova, 2020). Las mediciones sirven para trabajar y generar

información relevante en la toma de decisiones, estudios, investigaciones y proyectos que

permiten prevenir ante eventos como deslizamientos de tierra, sequías e incluso inundaciones

(tencalie), este problema se aborda desde dos opciones, trabajar directamente con la base de

datos incompleta (gil et 2007) o imputar los datos, la primera opción perjudica los resultados y la

segunda requiere de una imputación confiable para no caer en lo mismo (tenc 2015). Para

imputación de datos la media y la mediana son medidas estadísticas comúnmente usadas en la

literatura, varios investigadores han estudiado la imputación de datos faltantes con métodos

estadísticos (regonda 2013), también hay métodos estadísticos avanzados para la imputación, sin

embargo, funciona para variables especificas con métodos para temperatura por un lado y para

precipitación por otro y generalmente no se encuentra un método que impute ambas variables a

la vez, así también, no existe un método de imputación para varias variables simultáneamente y

solo funcionan indistintamente uno de otro dependiendo de la variables.

En Chile la disponibilidad de datos para imputación de la variable caudal no se ajusta a los

métodos implementados en la literatura y es necesario un método de imputación implementado

con los datos disponibles.


8

Machine Learning es un método robusto en la imputación de datos (King2015), los

requerimientos en el algoritmo Random Forest (Bosques Aleatorios) para este fin en su

implementación permite hacer uso de la base de datos Camels-CL, que corresponde a la base de

datos más completa del país en cuanto a las siguientes variables: caudal, atributo de cuenca,

precipitación y temperatura. Se espera implementar el método para imputar datos en las regiones

de Coquimbo, Valparaíso y Metropolitana desde enero 1979 hasta diciembre 2019 y obtener un

resultado confiable.

1.1.2.

1.1. Base de datos

1.2. Población

1.3. Muestra

1.4. Imputación

2. Capítulo II

Estado del arte

En este capítulo se revisará aquello que es pertinente a la imputación de datos y se basa en el

estado del arte presentados por (hanzam, 2020), según expone el autor para realizar la

imputación de datos aplicando un determinado método, se deben tener en cuenta una serie de

consideraciones relacionadas con los datos faltantes

a) Porcentaje: permite conocer la proporción de la tasa faltante en los datos, una proporción

convincente en los datos de caudal no ha sido expuesta en la literatura, (shafer 1997)

afirmo que una tasa faltante del 5% o una cantidad menor es insignificante, (Bennet

2001) afirmo que siempre que el porcentaje de los datos exceda el 10% el análisis es
9

parcial, (dong y pen 2013) coincidieron en que la falta de datos en un 20% es algo común

en investigación, mientras que (widman 2006) encasillo los datos faltantes de acuerdo

con el porcentaje de datos faltantes, tal como se describe en la tabla 1

Tabla 1

Datos faltantes según (widman 2006).

Porcentaje de datos faltantes Categoría


1% - 2% Despreciable
5% - 10% Menor
10% - 25% Moderado
25% - 50% Alto
>50% Excesivo

b) Patrón: Refiere a como se dispersan los valores faltantes dentro del conjunto de datos (Tab y

fidel 2014) señala que los mecanismos de datos faltantes y los patrones tienen una gran

influencia en los resultados de la investigación en comparación con el porcentaje de datos

faltantes, (collins 1991) describió y dividió el patrón de datos faltantes en dos grupos por un lado

patrones generales (aleatorios) donde los datos faltantes ocurren en cualquiera de las variables y

en cualquier posición y por otro patrones especiales que incluyen datos faltantes univariados,

unidades sin respuesta y datos faltantes monótonos

c) tipo

3. Capítulo III

Planteamiento del problema

3.1. Datos ausentes


10

3.1.1.

4. Capítulo IV

Objetivos

4.1. Objetivo general

Implementar un método de imputación para datos de caudales de ríos en chile

4.2. Objetivos específicos

Estudiar de los métodos propuestos en la literatura

Imputar datos en series temporales de caudales de ríos

Evaluar los resultados del método implementado

4.3. Hipótesis

Random Forest sirve para imputación de datos y es factible de ser mejorado


11

5. Capítulo V

Metodología

5.1. Método de imputación de datos

5.1.1. Random Forest

5.1.1.1. Miss Forest

5.2. Imputación de datos

5.2.1. Lo necesario

5.2.1.1. Problema de imputación

5.2.1.1.1. Solución única

5.3. Evaluación de resultados

5.3.1. Homogeneidad

5.3.1.1. Método de tres sigmas

5.3.1.2. Coeficiente de variación

5.3.1.3. Test de Lever


12

6. Capítulo VI

Aplicación

6.1. Recopilación de datos

6.1.1. Base de datos original

6.1.1.1. Datos en Camels-CL

6.2. Análisis exploratorio de los datos

6.3. Organización de datos

6.3.1. Bases de datos generadas

6.3.1.1. Base de datos original

6.3.1.2. Base de datos subdividida

6.3.1.2.1. Datos por percentil

6.3.1.3. Base de datos dividida

6.3.1.3.1. Base de datos por percentil

6.4. Imputación de base de datos

6.4.1. Datos fijos y aleatorios

6.4.1.1. Datos presentes

6.4.1.2. Datos ausentes

6.5. Imputación según bases de datos

6.5.1. Población

6.5.2. Muestra

6.6. Comparación de la imputación

6.6.1. Según escalas

6.6.1.1. Base de datos


13

6.6.1.2. Resolución temporal

6.7. Resultado de la imputación

6.7.1. Homogeneidad

6.7.1.1. Método de tres sigmas

6.7.1.2. Coeficiente de variación

6.7.1.3. Test de Lever

7. Capítulo VII

Resultados

7.1. Análisis de imputación.

7.1.1. Imputación única

7.1.1.1. Base de datos original

7.1.1.2. Base de datos para imputación

7.1.1.2.1. Título nivel 5

8. Capítulo VIII

Conclusiones

9. Capítulo IX

Bibliografía

10.
14

11. Capítulo II

11.1. Título nivel 2

11.1.1. Título nivel 3

11.1.1.1. Título nivel 4

11.1.1.1.1.Título nivel 5
15

12. Capítulo III

Tablas y Figuras

12.1. Tablas APA 7ma edición

1.1.3. Si de originalidad se trata, las normas APA tienen un doctorado. Es por eso que

se han mantenido vigentes con el pasar de los años y es un criterio casi

obligatorio a la hora de redactar un informe, documento, artículo, etc. de

carácter científico.

Tabla 2

El título debe ser claro y descriptivo.

variables categoría categoría categoría categoría categoría


Variable 1 xx xx xx xx xx
Variable 2 xx xx xx xx xx
Variable 3 xx xx xx xx xx
Variable 4 xx xx xx xx xx
Variable 5 xx xx xx xx xx
Total xx xx xx xx xx
Nota: times new roman 10.

1.1.4. Si de originalidad se trata, las normas APA tienen un doctorado. Es por eso que

se han mantenido vigentes con el pasar de los años y es un criterio casi

obligatorio a la hora de redactar un informe, documento, artículo, etc. de

carácter científico.

Tabla 3

asdasdsadsadad.

variables categoría categoría categoría


Variable 1 xx xx xx
Variable 2 xx xx xx
Variable 3 xx xx xx
Variable 4 xx xx xx
Variable 5 xx xx xx
Total xx xx xx
16

Nota: times new roman 10.

1.1.5.

Tabla 4

El título debe ser claro y descriptivo

variables categoría categoría categoría categoría categoría


Variable 1 xx xx xx xx xx
Variable 2 xx xx xx xx xx
Variable 3 xx xx xx xx xx
Variable 4 xx xx xx xx xx
Variable 5 xx xx xx xx xx
Total xx xx xx xx xx
Nota: times new roman 10.

12.2. Figuras APA 7ma edición

Figura 1

el titulo debe ser breve y conciso

Nota: times new roman 10.


17

1.1.6. Si de originalidad se trata, las normas APA tienen un doctorado. Es por eso que

se han mantenido vigentes con el pasar de los años y es un criterio casi

obligatorio a la hora de redactar un informe, documento, artículo, etc. de

carácter científico.

Figura 2

xxxxxxxxxxxxxxxxx

Nota: times new roman 10.


18

13. Capítulo IV

Citas y Referencias

Citas Directas

Cita corta

- Parenética

La ira es considerada como una simple reacción humana, y el pecado de la ira depende del grado

en que se manifieste: “Cuando el movimiento instintivo pasional de la ira se despierta, nos ciega,

nos estupidiza y nos convierte en una especie de bestias obcecadas. Ese exceso es perjudicial,

pero yo creo que un punto de cólera es necesario” (Savater, 2005, p. 81).

- Narrativa

Para Savater (2005), como para muchos, la ira es una simple reacción humana, y el pecado de la

ira depende del grado en que se manifieste: “Cuando el movimiento instintivo pasional de la ira

se despierta, nos ciega, nos estupidiza y nos convierte en una especie de bestias obcecadas. Ese

exceso es perjudicial, pero yo creo que un punto de cólera es necesario” (p. 81).

Cita en bloque

- Parenténica

1.1.7. En definitiva, el asentamiento de blancos, mestizos y algunos esclavos se debió

a las políticas de agregación y segregación de tierra para la explotación de

ganado y sembradíos:

Jurídicamente estaba justificado el asalto de las tierras de los indios. Entre el año de 1750

y el de 1800, época en que las comunidades indígenas del oriente colombiano fueron

objeto de una política de agregación-segregación de tierras, el monto de las ventas de

unos 68 resguardos fue de 110 308 pesos aproximadamente. En 1778, Moreno y


19

Escandón informaba desde San Gil, que la venta de solo 18 pueblos había representado

un ingreso al erario de 45 560 pesos. (Tovar, 1986, p. 23)

- Narrativa

El asentamiento de blancos, mestizos y algunos esclavos está directamente relacionado con las

políticas de agregación y segregación de tierra, que advierte Tovar (1986), para la explotación de

ganado y sembradíos:

Jurídicamente estaba justificado el asalto de las tierras de los indios. Entre el año de 1750

y el de 1800, época en que las comunidades indígenas del oriente colombiano fueron

objeto de una política de agregación-segregación de tierras, el monto de las ventas de

unos 68 resguardos fue de 110 308 pesos aproximadamente. En 1778, Moreno y

Escandón informaba desde San Gil, que la venta de solo 18 pueblos había representado

un ingreso al erario de 45 560 pesos. (pág. 23).

Citas Indirectas

Parenténica

Finalmente, la ruralidad se puede referir al desarrollo rural, en el cual se contemplan estrategias

de atención a poblaciones marginadas, vulnerables, desarticuladas, etcétera (Dirven , et ál.,

2018).

- Narrativa

Finalmente, Dirven et ál. (2018) definen la ruralidad a partir del desarrollo rural, en el cual se

contemplan estrategias de atención a poblaciones marginadas, vulnerables, desarticuladas,

etcétera.

Comunicaciones Personales

- Citación parenténica
20

(C. Robayo, comunicación personal, 3 de mayo de 2018

- Citación narrativa

T. Reyes (comunicación personal, 5 de febrero de 2017)

También podría gustarte