Está en la página 1de 155

UNIVERSIDAD DE SANTIAGO DE CHILE

FACULTAD DE INGENIERIA
DEPARTAMENTO DE INGENIERIA GEOGRAFICA

MODELO MATEMATICO LOCAL PARA LA ESTIMACION DE


COTA ORTOMETRICA

ELEAZAR QUIÑIMIL VASQUEZ


MAURICIO JAVIER ABUSLEME OJEDA
2008
UNIVERSIDAD DE SANTIAGO DE CHILE
FACULTAD DE INGENIERIA
DEPARTAMENTO DE INGENIERIA GEOGRAFICA

MODELO MATEMATICO LOCAL PARA LA ESTIMACION DE


COTA ORTOMETRICA

“TRABAJO DE TITULACION PRESENTADO EN


CONFORMIDAD A LOS REQUISITOS PARA OBTENER EL
TITULO DE INGENIERO DE EJECUCION EN GEOMENSURA”

Profesor Guía: Héctor Patricio Contreras Ávila

ELEAZAR QUIÑIMIL VASQUEZ


MAURICIO JAVIER ABUSLEME OJEDA
2008
AGRADECIMIENTOS.

Si me pongo a pensar en este proceso de 4 años, siento que he tenido que


superar varias dificultades, que sin la ayuda de Dios y de ciertos íconos de mi
vida, hubiera sido imposible de lograr. Gracias a mi hermano Aurelio, por confiar
en mi, por tener la visión necesaria, para darme la oportunidad que yo llegue
lejos. A mi madre, por el apoyo incondicional, porque nunca me falto nada, por
inculcarme tu espíritu de lucha y porque eres mi ejemplo a seguir. A mi
hermano César y su familia, que aunque estén lejos siempre estuvieron
dándome apoyo.

Agradezco a todos mis amigos que me acompañaron en este proceso, ellos


saben personalmente lo mucho que los quiero y que nunca olvidare todo lo que
pasamos juntos. A mi compañero de tesis, por apoyarme siempre y por dar todo
para sacar la tesis adelante. A ti por simplemente estar ahí y hacerme feliz. A
todos los profesores que me acompañaron en este proceso...

En fin, a todos ellos y a los que se sientan identificados con la causa......gracias.

Mauricio Abusleme.
Siempre se cometen injusticias en los agradecimientos,
pues la “memoria” es a menudo traicionera.

Agradezco en primer lugar a Blanca Vásquez (tía Olga), que me trajo al mundo
y que nos hemos acompañado y amado por tanto tiempo, en el mismo orden
agradezco a mi hermana Doris la “Quiñimil” que me va quedando, y que aunque
hemos pasado malos momentos se que estará en las buenas y las malas por
siempre. Con todo lo anterior agradezco a mi pequeña, pero amada familia, y
mientras todo esto pasa doy un vistazo al cielo, porque si veo a mi padre
orgulloso entonces entiendo que las cosas van bien.

Agradezco a cada uno, a cada dos, y cada todos los que han estado presentes
durante este trabajo de titulación, esta etapa, y como no toda mi vida (en
especial a ti que te has interesado, y me has acompañado este tiempo).
Hablando netamente de nuestro trabajo de titulación, agradezco al profesor
Héctor Contreras que nos acompañó tantos viernes en la tarde y que nos ayudó
en todo momento. En este sentido quiero dar un merecido gracias y un enorme
abrazo a ti Mauricio (Busleme) sin tu persona esto no hubiera sido lo mismo,
discutimos, reímos, nos cansamos, nos frustramos, nos ayudamos, y nos
conocimos un poco más. Gracias también a tu familia que siempre se preocupo
en todo sentido. Fue un agrado trabajar con un amigo, no nos sacamos los ojos,
si tuvimos diferencias, pero el trabajo esta hecho, y muy bien hecho.

Eleazar Quiñimil Vásquez


RESUMEN.

La utilización del sistema de posicionamiento global (GPS) es cada vez más


frecuente y necesaria. Esto, debido en gran parte, a sus resultados rápidos y
precisos. Pero, pese a todas sus ventajas, en ingeniería esta tecnología es
utilizada a nivel planimétrico. Dejando muchas veces la componente altimétrica,
entregada por el receptor, de lado y sin utilización alguna.

Esta memoria estudia un método matemático que sea capaz de estimar altura
ortométrica, aprovechando la precisión de la altura elipsoidal que entrega el
receptor GPS. Para esto se realizaron modelos de regresión múltiple en dos
aplicaciones. La primera en una zona de la Región Metropolitana, y la segunda
en una línea de nivelación en la cuesta Lo Prado. Se compara ambos modelos
con la calibración vertical realizada por el software Trimble Geomatics Office
(TGO) de donde se concluyó que, dentro de una zona o línea de nivelación
estudiada, el modelo de regresión múltiple entrega mejores resultados que el
software TGO.

Finalmente se realizó, en el software Arcview GIS, una automatización para el


cálculo de los modelos, esperando que a futuro los software comerciales
integren este tipo de aplicaciones, para así, aumentar las precisiones, y reducir
costos y tiempo en los trabajos de ingeniería. Queda invitado el lector a
profundizar en las herramientas que entrega la ciencia en pro de la solución de
problemas atingentes a la rama de Geomensura, siendo esta memoria solo un
paso en este constante aprendizaje.

Palabras clave
■ Inferencia Estadística. ■ Regresión múltiple.
■ Altimetría. ■ Arcview.
ABSTRACT.

The use of Global Positioning System (GPS) is becoming more frequent and
necessary. This is due largely, to its quick and precise results. But in spite of all
its advantages, this technology is used at a planimetric level in engineering,
leaving the altimetric component, given by the receiver, without any use.

This thesis studies a mathematical method capable of estimating orthometric


height, taking advantage of the precision of the ellipsoid height given by a GPS
receiver. To achieve this, multiple regression models were made in two
applications. The first one is placed in an area of the Region Metropolitana, and
the second one in a leveling line in Cuesta Lo Prado. Comparing both models
with the vertical calibration made by Trimble Geomatics Office (TGO) software.
Where, it concluded, that within a studied area or leveled line, the multiple
regression model gives better results than the TGO software.

Finally, an automation to calculate the models in ArcView GIS software was


made. Hoping that future commercial software integrate this type of applications.
Then, it will be possible to increase precisions, and reduce costs and time in
engineering works. The reader is invited to go deeper on the tools given by
science in favour of the solution of problems related to Surveying. This thesis is
only a step in this constant learning.

Key words:

• Statistical Inference
• Altimetry
• Multiple Regression
• Arcview
INDICE GENERAL.

CAPITULO I – INTRODUCCION.
1.1 Antecedentes. 1
1.2 Estado actual del problema. 1
1.3 Hipótesis. 3
1.4 Objetivos. 3
1.4.1 Objetivo general. 3
1.4.2 Objetivos específicos. 3
1.5 Metodología de trabajo. 4

CAPITULO II – CONCEPTOS Y METODOLOGIA DE TRABAJO.


2.1 Introducción. 6
2.2 Conceptos previos geodésicos. 6
2.2.1 El elipsoide. 7
2.2.2 El geoide. 8
2.2.3 Datum geodésico. 9
2.2.4 Altura elipsoidal. 10
2.2.5 Altura ortométrica. 10
2.3 Sistemas de coordenadas. 11
2.3.1 Coordenadas cartesianas. 11
2.3.2 Coordenadas geodésicas. 12
2.3.3 Relación matemática entre coordenadas cartesianas y
Geodésicas. 13
2.4 Sistemas de referencia geodésicos. 14
2.4.1 Sistemas locales de referencia. 15
2.4.2 Sistemas globales de referencia. 16
2.4.3 International Terrestrial Reference Frame (ITRF) 16
2.4.4 Sistema WGS-84. 18
2.4.5 Sistema de referencia para las Américas (SIRGAS) 19
2.5 Sistema de posicionamiento global (GPS) 20
2.5.1 Señal GPS. 21
2.5.2 Fuentes de error GPS. 22
2.6 Transformación bidimensional de coordenadas. 23
2.6.1 Tipos de transformaciones bidimensionales. 23
2.6.2 Modelo de ajuste. 26
2.6.3 Precisión del método de ajuste. 29
2.7 Inferencia estadística. 31
2.7.1 Introducción. 31
2.7.2 Conceptos básicos de inferencia estadística. 32
2.7.3 Regresión Múltiple. 35
2.7.4 Estimación de los parámetros del modelo. 37
2.7.5 Propiedades de los estimadores. 39
2.7.6 Análisis de la varianza. 44
2.7.7 Correlación. 49

CAPITULO III – DESARROLLO.


3.1 Introducción. 53
3.2 Aplicacion1: Uso de regresión múltiple en una zona de la Región
Metropolitana. 54
3.2.1 Obtención de los coeficientes del modelo. 56
3.2.2 Intervalos de confianza. 58
3.2.3 Contrastes individuales de la t para los coeficientes del
Modelo de regresión. 60
3.2.4 Tabla ANOVA (contraste conjunto de la F) 63
3.2.5 Coeficientes de determinación y de correlación del
Conjunto. 64
3.2.6 Coeficientes de determinación y correlación
Individuales. 65
3.2.7 Aplicación del Modelo. 66
3.2.8 Calibración Local GPS de la zona de estudio Región
Metropolitana con Software Trimble Geomatics
Office (TGO) 73
3.3 Aplicación 2: Línea de nivelación Cuesta lo Prado. 76
3.3.1 Introducción. 76
3.3.2 Calculo y ajuste de Alturas ortométricas Cuesta
lo Prado. 78
3.3.3 Ajuste de los desniveles a través de modelo de ecuaciones
de condición. 83
3.3.4 Aplicación 2: Uso de regresión múltiple en la línea de
Nivelación Cuesta lo prado. 88
3.3.5 Aplicación de ajuste TGO a la línea de nivelación cuesta lo
Prado. 96
3.4 Automatización en software Arcview Gis 3.3 97
3.4.1 Automatización coordenadas planimétricas. 97
3.4.2 Automatización de parámetros verticales. 100
3.4.3 Datos desplegables a la vista. 108

CAPITULO IV – ANALISIS DE RESULTADOS.


4.1 Antecedentes. 111
4.2 Análisis aplicación 1: Zona estudio Región Metropolitana. 111
4.2.1 Contraste residuos TGO y Modelo de regresión múltiple. 111
4.2.2 Validación parámetros de estimación Altura ortométrica
aplicación 1. 113
4.2.3 Intervalos de confianza y de predicción. 117
4.3 Análisis aplicación 2: Línea de nivelación cuesta lo Prado. 119
4.3.1 Contraste residuos TGO y Modelo de regresión múltiple 119
4.3.2 Validación parámetros de estimación Altura ortométrica. 120

CAPITULO V – CONCLUSIONES Y RECOMENDACIONES.


5.1 Conclusiones. 122
5.2 Recomendaciones. 126

ANEXOS. 128
BIBLIOGRAFIA. 139
INDICE DE FIGURAS.

2.1 El Elipsoide 7
2.2 Relación Elipsoide-geoide 8
2.3 Altura Ortométrica 10
2.4 Relación Geométrica entre coordenadas cartesianas y geodésicas 13
2.5 Estaciones ITRF2005 17
2.6. Movimiento de las placas terrestres obtenido por
ITRF2005 (1 cm/año) 18
2.7. Parámetros WGS 84 19
2.8. Representación grafica de ejes XY girados, trasladados y escalados 25
3.1. Relación entre variables 53
3.2. Puntos dispuestos geográficamente aplicación 1 55
3.3. Propiedades del proyecto en software TGO 73
3.4. Datos importados TGO (aplicación 1) 74
3.5. Calibración local vertical TGO 75
3.6. Trimble R8 y Leica serie TPS400 78
3.7. Corrección a la línea 79
3.8. Calculo de distancias horizontales 79
3.9. Mediciones reciprocas y simultaneas 77
3.10. Pasos ajuste por mínimos cuadrados 84
3.11. Disposición geográfica de puntos cuesta lo prado 89
3.12. Parámetros de transformación bidimensional 98
3.13. Transformación bidimensional de coordenadas 99
3.14. Tabla de datos exportados 99
3.15. Estimación parámetros verticales Arcview 100
3.16. Caja de dialogo estimación vertical 101
3.17. Centroide automatizado, obtenido de datos insertados para realizar
Regresión 101
3.18. Módulos de utilización de Multiple Regression - Free
Statistics Software (Calculator) 103
3.19. Valores a insertar en calculadora 104
3.20. Resultados entregados por Multiple Regression - Free Statistics
Software (Calculador) 105
3.21. Tabla de validación 106
3.22. Caja transformación vertical 107
3.23. Resultado transformación vertical en arcview 108
3.24. Add Event Theme 110
3.25. Vista de puntos importados a las capas 110
4.1. Subzonas establecidas por distancia a su centro 114
4.2. Distribución espacial de residuos aplicación 1 aplicada
a los 56 puntos 115
4.3. Distribución espacial de residuos TGO aplicada a los 56 puntos 115
4.4. Distribución espacial de residuos en valor absoluto
de la aplicación 1, en los 100 km2 de la zona de estudio 116
4.5. Distribución espacial de residuos en valor absoluto del software
TGO, en los 100 km2 de la zona de estudio 116
4.6. Puntos de control cuesta lo prado 120
INDICE DE TABLAS.

2.1. Parámetros PSAD56, SAD69 e Hito XVIII 16


2.2. Tabla ANOVA del modelo de regresión múltiple 45
3.1. Puntos del Set de datos a utilizar aplicación 1 54
3.2. Coordenadas Centroide aplicación 1 55
3.3. Tabla ANOVA del contraste conjunto de la F(aplicación 1) 63
3.4. Tabla ANOVA de variable “Este” respecto variable
“Altura ortometrica” 65
3.5. Coeficientes de correlación y determinación individuales 66
3.6. Alturas Ortometricas obtenidas con regresión múltiple 66
3.7. Residuos simples, estandarizados y estudentizados Aplicación 1 69
3.8. Parámetros de Ajuste Vertical TGO (Aplicación 1) 75
3.9. Resumen errores TGO (Aplicación 1) 75
3.10. Alturas ortométricas entregadas por TGO (Aplicación 1) 76
3.11. Resultados poligonal 1 82
3.12. Resultados poligonal 2 83
3.13. Resultados alturas ortométricas ajustadas, poligonal 1 87
3.14. Resultados alturas ortométricas ajustadas, poligonal 2 88
3.15. Puntos para confección modelo regresión múltiple cuesta lo prado 89
3.16. Parámetros modelo regresión múltiple Cuesta Lo Prado 90
3.17. Contraste conjunto de la F cuesta lo prado 91
3.18. Residuos simples, estandarizados y estudentizados,
cuesta lo prado 91
3.19. Parámetros y centroide modelo, nueva regresión múltiple
5 parámetros 93
3.20. Tabla ANOVA nueva regresión múltiple 5 parámetros 94
3.21. Residuos simples, estandarizados y estudentizados, modificación
modelo cuesta lo prado 94
3.22. Parámetros ajuste vertical TGO cuesta lo prado 96
3.23. Alturas ortométricas entregadas por TGO, cuesta lo prado 96
4.1. Tolerancias altimétricas dependiendo de la escala 112
4.2. Precisiones modelo aplicación 1 v/s TGO, por subzonas 114
4.3. Altura ortométrica de puntos muéstrales 117
4.4. Estimación y predicción para muestras 118
4.5. Intervalos de confianza e intervalos de predicción 118
4.6. Puntos de control cuesta lo prado, aplicando modelo de regresión 121
INDICE DE GRAFICOS.

3.1. Histograma de residuos (Aplicación 1) 70


3.2. Probabilístico de normalidad (p-p y q-q) y simetría 70
3.3. Residuos estandarizados v/s Predicciones (aplicación 1) 72
3.4. Predicciones v/s Variable respuesta (aplicación 1) 72
3.5. Predicciones v/s Variable respuesta cuesta lo prado 92
3.6. Residuos estandarizados v/s Predicciones cuesta lo prado 92
3.7. Predicciones v/s Variable respuesta, modificación modelo
cuesta lo prado 95
3.8. Residuos estandarizados v/s Predicciones, modificación
modelo cuesta lo prado 95
4.1. Comparación Residuos Modelo de regresión v/s Residuos
TGO (aplicación 1) 112
4.2. Comparación Residuos Modelo de regresión aplicación 2
v/s Residuos TGO 119
1

CAPITULO I – INTRODUCCION

1.1 ANTECEDENTES.

Como se sabe actualmente, el Sistema de Posicionamiento Global (GPS) nos


entrega alturas referidas a un elipsoide de referencia y no al geoide, siendo este
último el utilizado como datum vertical actualmente en América Latina.

Ahora, la altura geodésica “h”, obtenida desde los receptores GPS es altamente
precisa, aunque no todavía con una utilización practica en ingeniería. Por esto,
es de interés utilizar esta altura geodésica y transformarla a una altura
ortométrica, la cual sí se utiliza para referenciar todo tipo de proyectos
ingenieriles. Hoy en día existen formas de llevar a cabo este traspaso de
alturas, tanto por modelos geoidales o por la utilización de programas
computacionales que calibren mediciones GPS. Lo que hace que el usuario
pueda conocer la altura ortométrica de un lugar, sólo con mediciones GPS, pero
que generalmente es de una baja precisión.

En estos casos es necesario, para la obtención de una altura ortométrica


precisa, llevar hasta el lugar una línea de nivelación geométrica, la que suele
ser costosa y consumidora de tiempo.

1.2 ESTADO ACTUAL DEL PROBLEMA.

En Chile, la obtención de altura ortométrica a partir de GPS se realiza de dos


maneras. Por normativa descrita en el manual de carreteras Volumen II, y por
programas computacionales que calibren mediciones GPS.
2

Según la normativa descrita en el manual de carreteras Volumen II, en la


sección 2.312 Transporte de coordenadas mediante GPS, capítulo 2.312.6
Altimetría, señala que se pueden adoptar diversos criterios para realizar la
reducción al geoide:

• Aceptar que el área del levantamiento es suficientemente pequeña,


considerando el geoide plano o paralelo al elipsoide, omitiendo la
ondulación del geoide(N) en extensiones que varían entre 0 y 3
kilómetros. Se debe determinar el valor de N de al menos uno de los
puntos GPS, comparando la altura nivelada de dicho punto y aplicando
esa corrección a todos los demás puntos GPS del área.

• Aceptar que el geoide es plano y no paralelo al elipsoide. Este caso es


más preciso que lo anterior y se puede determinar con la utilización de
un mínimo de 3 puntos GPS con altura ortométrica conocida en la
periferia del área considerada. Las diferencias entre las alturas referidas
al elipsoide y ortométricas en esos puntos determinan un plano
considerado como un geoide local plano. Las reducciones a ese plano se
aplican proporcionalmente de acuerdo a la posición de cada punto GPS
restante.

• Uso directo del modelo geoidal global EGM 96, en donde para cada
punto tomado con GPS, se extrae la ondulación geoidal (N).

• Determinación de un geoide local. Igualmente como en el caso del


segundo criterio, pero con un mayor número de puntos GPS
uniformemente distribuidos con altura elipsoidal y ortométrica conocida.
En este caso se genera una superficie tridimensional que refleje más
fielmente el comportamiento del geoide en la zona levantada.
3

Con respecto a la utilización de programas computacionales, estos lo que


hacen, en simples palabras, es ajustar un conjunto de mediciones GPS a través
de puntos de altura ortométrica conocida, a un plano de referencia.

1.3 HIPOTESIS.

Se puede realizar un modelo matemático local que logre determinar altura


ortométrica, en la zona analizada, sin la necesidad de ejecutar una nueva
nivelación para ello, obteniendo resultados más precisos que los métodos
actuales utilizados en Chile.

1.4 OBJETIVOS

1.4.1 OBJETIVO GENERAL.

Lograr un modelo matemático local que reduzca, en tiempo y dinero, la


densificación de puntos en una zona específica, obteniendo así alturas
ortométricas precisas, sin necesidad de medir nuevos puntos.

1.4.2 OBJETIVOS ESPECIFICOS.

• Automatizar la transformación de coordenadas planimétricas locales a


distintas proyecciones (o viceversa) a través de una transformación
bidimensional de semejanza.

• Automatizar, y/o dar a conocer una forma de automatizar, el calculo de


un modelo matemático de regresión múltiple para la obtención de altura
ortométrica.
4

• Ambientar en una plataforma SIG la transformación planimétrica y de


altura ortométrica con parámetros ya conocidos.

1.5 METODOLOGIA DE TRABAJO

Para llevar a cabo los objetivos es necesario realizar una descripción de los
procedimientos escogidos, con el fin de cumplir la verificación de la hipótesis, la
metodología escogida para este proyecto cuenta con:

• Recopilación de material y antecedentes relacionados con el tema.

• Definición de forma clara y precisa de la hipótesis.

• Definición de objetivos generales y específicos, los cuales deben


enmarcarse dentro de los límites del tema.

• Planificación y recopilación de datos de una zona de la Región


Metropolitana.

• Planificación y recopilación de datos tomados en la tesis “Metodología y


desarrollo para la georreferenciación de un proyecto vial cuesta Lo
Prado” María José Herrera, José Salas.

• Ordenamiento y obtención de alturas ortométricas para las dos


aplicaciones.

• Realización de los modelos, a través de regresión múltiple, para la


estimación de altura ortométrica.
5

• Contraste de resultados obtenidos a través de regresión múltiple, para


las dos aplicaciones, con los resultados entregados por el software de
procesamiento GPS Trimble Geomatics Office.

• Aplicación de los modelos obtenidos para la estimación de altura


ortométrica. Entregando su precisión en las distintas zona de estudio.

• Automatización del cálculo de transformación bidimensional, de


coordenadas planimétricas, a través de lenguaje de programación
Avenue.

• Automatización del cálculo de alturas ortométrica, con parámetros de


regresión múltiple conocidos, a través de lenguaje de programación
Avenue.

• Integración de capas geográficas de Chile, y cálculos automatizados en


plataforma Arcview GIS 3.3

• Análisis y Conclusiones.
6

CAPITULO II: CONCEPTOS Y METODOLOGIA DE TRABAJO.

2.1 INTRODUCCIÓN.

La geodesia estudia la forma, dimensiones y campo gravitatorio de la tierra en


territorios extensos. Como se sabe, esta es su principal diferencia con la
topografía, la cual basa sus trabajos en superficies de extensión reducida en las
cuales se puede considerar despreciable la esfericidad terrestre. En esencia, la
Geodesia comienza sus trabajos allí donde termina la topografía. De todas
formas, no debe considerarse el estudio de estas ciencias por separado, pues
están íntimamente relacionadas, de tal manera que la topografía necesitará
apoyarse en la geodesia para una gran cantidad de aplicaciones prácticas.

En este trabajo se aplicarán conceptos de la geodesia física, que según P.S


Zakatov en su libro Curso de Geodesia Superior, la define como “la parte de la
geodesia superior que analiza los métodos de estudio de la figura de la tierra
como cuerpo físico y geométrico en base a las leyes de la mecánica y a datos
experimentales, o sea, como resultado de las mediciones geodésicas,
gravimétricas y astronómicas” y conceptos de la geodesia matemática que
formula los métodos y las técnicas para la construcción y el calculo de las redes
de coordenadas de referencia.

2.2 CONCEPTOS PREVIOS GEODÉSICOS.

A continuación se definirán conceptos para el buen entendimiento de este


trabajo, tanto en las áreas de la geodesia física, como la geodesia matemática.
7

2.2.1 El elipsoide.

Como se sabe la tierra no es redonda, y su figura se asemeja a una esfera


achatada en los polos, no existiendo una figura geométrica que la represente a
cabalidad, debido fundamentalmente a las irregularidades existentes. Estas
irregularidades de la tierra son detectables y no extrapolables a todos los
puntos simétricos de la tierra, ya que no existe un único modelo matemático que
represente toda la superficie terrestre, debido a que cada continente, nación o
país, emplea un modelo matemático distinto de forma que se adapte mejor a la
forma de la tierra en la zona a cartografiar. (Ignacio Alonso Fernández-Coppel, El datum)

Esta representación matemática se le denomina Elipsoide, que es un sólido


generado por la rotación de una elipse sobre su eje menor (Figura2.1). Está
definida por los siguientes parámetros: Semieje mayor(a), Semieje menor (b),
achatamiento (ƒ) y la primera y segunda excentricidad ( e y e’ respectivamente)
y las relaciones entre ellos son las siguientes:

a−b a2 + b2 a2 + b2
ƒ = e= e' =
a a b

Figura 2.1 El Elipsoide.


Fuente: “La tierra”, por Dagoberto Salazar.
http://nacc.upc.es/tierra/node25.html
8

2.2.2 El geoide.

Se define al geoide como la superficie teórica de la tierra que une todos los
puntos que presenten igual potencial de gravedad. La forma así creada supone
la continuación por debajo de la superficie de los continentes, de la superficie
de los océanos en calma y mares suponiendo la ausencia de mareas, además
de la ausencia de perturbaciones exteriores (atracción de la luna y las
interacciones de todo el sistema solar), siendo así coincidente con el Nivel
medio del mar (NMM). Lejos de lo que se podría imaginar, esta superficie no es
uniforme, sino que presenta una serie de irregularidades, causadas por la
distinta composición mineral del interior de la tierra y de sus distintas
densidades, lo que implica que para cada punto de la superficie terrestre exista
una distancia distinta desde el centro de la tierra al punto del geoide. (Ignacio Alonso
Fernández-Coppel, El datum)

El geoide se extiende por los continentes sin interrupciones, sin embargo se


hundirá por debajo del elipsoide debido a la deficiencia de masa (océanos), por
otro lado , donde existan concentraciones de masa el geoide se levantará sobre
el elipsoide. A esta separación entre elipsoide y geoide se llama ondulación
geoidal (N) como se muestra en la figura 2.2.

Figura 2.2 Relación Elipsoide-geoide.


Fuente: “El geoide para el área mexicana
y sus aplicaciones” por David Ávalos Naranjo.
9

Pero se debe tener cuidado de no confundir al geoide con el nivel medio del
mar, ya que este ultimo vendría siendo en estricto rigor un cuasi-geoide debido
a que varía constantemente y no es el mismo conforme uno se mueve a lo largo
de una costa, mucho menos entre océanos distintos.

2.2.3 Datum geodésico.

El datum geodésico es la superficie de referencia para el cálculo y


determinación de coordenadas, estableciéndose datos iniciales de los cuales se
deriva el resto. Está compuesto por:

• Una superficie de referencia con definición geométrica exacta,


generalmente un elipsoide de revolución.
• Un “punto fundamental”, en el que coinciden las verticales al geoide y al
elipsoide.

En geodesia se emplean dos tipos de datum, el horizontal y el vertical:

• Datum Horizontal: Permite la determinación de la latitud y longitud. Se


elige un punto en el cual las superficies del elipsoide de referencia y del
geoide sean tangentes. De esta forma la vertical del geoide
(astronómica) y la vertical del elipsoide (geodésica) coincidirán, así
también, sus respectivas coordenadas.

• Datum Vertical: Es independiente del datum horizontal y es la superficie


que permite el cálculo de las alturas. Lo más usual es que esta superficie
sea el geoide o referida al nivel medio del mar.
10

2.2.4 Altura elipsoidal.

Las alturas elipsoidales (h) representan la separación entre la superficie


topográfica terrestre y el elipsoide, calculada sobre la línea perpendicular a este
último.

Las alturas elipsoidales son obtenidas a partir de las coordenadas geocéntricas


cartesianas (X, Y, Z) definidas sobre un elipsoide de referencia (por ejemplo el
modelo Geodetic Reference System 1980, GRS80, o el World Geodetic System
1984, WGS84, los cuales, en la práctica, son iguales), y determinadas a partir
del posicionamiento satelital de los puntos de interés. (Grupo de Trabajo III SIRGAS).

2.2.5 Altura ortométrica.

Figura 2.3 Altura Ortométrica.


Fuente: Grupo de Trabajo III–SIRGAS

Los números geopotenciales son divididos por el valor medio de la gravedad


verdadera (g') entre el punto evaluado y el geoide. (Figura 2.3)

C
H ( ortom ) =
g'
11

Debido a que no es posible determinar directamente el valor de g’, es necesario


introducir hipótesis sobre distribución de masas internas terrestres. También las
alturas ortométricas pueden obtenerse a partir de las alturas elipsoidales
mediante la sustracción de las ondulaciones geoidales (N):

H ( ortom ) = h − N

2.3 SISTEMAS DE COORDENADAS.

Cuando es necesario identificar la posición de un punto sobre el espacio se


utilizan los sistemas terrestres o geodésicos de referencia. Éstos
alternadamente, son asociados a una superficie que más se aproxime a la
forma de la tierra (elipsoide), en la cual se desarrollan todos los cálculos para
obtener sus coordenadas. Las coordenadas se pueden presentar en diversas
formas: referidas a un elipsoide determinado, denominadas coordenadas
geodésicas y en una superficie plana, que se denominará dependiendo de la
proyección que se ocupe, como por ejemplo, coordenadas UTM.

Las coordenadas referidas a los sistemas de referencia geodésicos son


presentadas principalmente como: Cartesianas, Geodésicas o Elipsoidales y
planas.

2.3.1 Coordenadas cartesianas.

Es un sistema dextrógiro en donde el elipsoide está asociado a un sistema


cartesiano ortogonal formado por los ejes XYZ. El eje X está contenido en el
plano ecuatorial, orientado al meridiano cero (Greenwich), Z coincide con el eje
de rotación terrestre y está orientado en la dirección del polo norte, el eje Y
completa el sistema dextrógiro siendo perpendicular a los dos anteriores.
12

2.3.2 Coordenadas geodésicas.

Las coordenadas geodésicas determinan la posición espacial de un punto


cualquiera sobre un elipsoide determinado, que represente de mejor manera a
la tierra o una zona particular. Quedan determinadas por:

Latitud (φ): ángulo formado por la normal al punto a definir y su proyección


sobre el ecuador, varia de +90º a -90º y toma valores negativos al sur del
ecuador.

Longitud (λ): ángulo entre la sección meridiana que contiene al punto y el


meridiano de Greenwich, su graduación va de 0º a 180º, siendo negativas al
oeste del meridiano 0º y positivas al este.

Altura Elipsoidal (h): Corresponde a la distancia del punto a la superficie del


elipsoide, medida sobre su normal.
13

Figura 2.4 Relación Geométrica entre coordenadas cartesianas y geodésicas.


Fuente: Conceptos geodésicos básicos. http://www.colegiochubut.org.ar/agrimensores

2.3.3 Relación matemática entre coordenadas cartesianas y geodésicas.

Como se ve en la figura 2.4, un punto sobre la superficie terrestre, tiene


coordenadas cartesianas (X,Y,Z) geocéntricas, que pueden ser expresadas en
coordenadas geodésicas (φ,λ,h), o viceversa, de acuerdo con las siguientes
relaciones matemáticas:

a- Transformación de coordenadas geodésicas a cartesianas. (φ,λ,h)Æ


(X,Y,Z).

X 1 = ( N + h) ⋅ cos φ ⋅ cos λ
Y1 = ( N + h) ⋅ cos φ ⋅ senλ
Z 1 = [ N ⋅ (1 − e 2 ) + h] ⋅ senφ

Donde:
a2 − b2
-1ª excentricidad (e): e2 =
a2
14

a
-Gran normal (N): N=
1 − e 2 ⋅ sen 2 φ

a y b: semiejes del elipsoide.

b- Transformación de coordenadas cartesianas geodésicas, (X,Y,Z)Æ


(Φ,λ,h):

⎡ Z 1 + b ⋅ e' 2 ⋅sen 3ψ ⎤
φ = arctan ⎢ ⎥
⎣ d − a ⋅ e ⋅ cos ψ ⎦
2 3

⎡Y ⎤
λ = arctan ⎢ 1 ⎥
⎣ X1 ⎦
d
h= −N
cos φ

Donde:
a2 − b2
-2da excentricidad (e’): e' 2 =
b2

Y las variables auxiliares son:

⎡ Z1 ⋅ a ⎤
d= X 1 + Y1
2 2
ψ = arctan ⎢ ⎥
⎣ d ⋅b ⎦

2.4 SISTEMAS DE REFERENCIA GEODÉSICOS.

Un sistema de referencia geodésico es un recurso matemático que permite


asignar coordenadas a puntos sobre la superficie terrestre. Deben distinguirse
los llamados sistemas locales que utilizan, para su definición, un elipsoide
15

determinado y un punto datum, y los sistemas globales cuyos parámetros están


dados por una terna rectangular (X, Y, Z) cuyo origen se encuentra en el
geocentro del planeta. Para definir las coordenadas geodésicas (latitud, longitud
y altura elipsoidal) cuentan con un elipsoide de revolución asociado. Esta es
una definición rigurosa pero abstracta, pues tanto el centro como los ejes son
inaccesibles en la práctica.

2.4.1 Sistemas locales de referencia.

Los sistemas locales de referencia son aquellos que adaptan el geoide a una
zona específica de la tierra, gracias a la utilización de un elipsoide determinado,
sobre este se realizan todos los cálculos geodésicos, con el previo
conocimiento de la posición geométrica del punto origen (datum) Además los
sistemas locales de referencia no son geocéntricos.

En las décadas de los años cincuenta y sesenta, para fines geodésicos y


cartográficos se definieron los sistemas de referencia sudamericanos, datum
Provisorio Sudamericano 1956 (PSAD56), con su vértice de origen en La
Canoa, Venezuela y datum Sudamericano 1969 (SAD69), con su origen en
Chua, Brasil.

Nuestro país ha adoptado como sistema de referencia oficial para el territorio


nacional, desde el extremo norte hasta la latitud 43° 30’ Sur, PSAD56, lo que
coincide aproximadamente con el límite entre las regiones X y XI. En el extremo
sur se utiliza el sistema SAD69 como referencia cartográfica, como también el
datum HitoXVIII en el extremo sur de la XII región.

En la tabla 2.1 se muestran los parámetros que definen a cada datum. La


cartografía sistemática escala 1/50000 editada por el IGM está referida a los
16

datums PSAD56, SAD69 e Hito XVIII, en las regiones correspondientes. Las


cartas IGM 1/25000 están referidas al SAD69. (Manual de carreteras Volumen II)

Tabla 2.1 Parámetros PSAD56, SAD69 e Hito XVIII.

Datum Elipsoide Semieje-mayor Achatamiento


PSAD56 Internacional 6.378.388 m 1/297
(Hayford)
SAD69 South American 6.378.160 m 1/298,25

1969 (UGGI-67)
Hito XVIII Internacional 6.378.388 m 1/297
(Hayford)

2.4.2 Sistemas globales de referencia.

A diferencia de los sistemas geodésicos locales, los sistemas geocéntricos son


tridimensionales y de alcance global. El concepto de punto datum desaparece, y
es reemplazado por el origen y orientación de la terna de referencia. Esta terna
consiste en los ejes ortogonales cartesianos X, Y, Z centrados en el centro de
masas de la tierra. Estos sistemas terrestres (fijados a la Tierra) tienen el eje X
solidario al meridiano origen de las longitudes y el eje Z próximo al eje de
rotación, por lo tanto este sistema “gira” juntamente con la tierra. Estos sistemas
resultan imprescindibles para ubicar puntos ligados al planeta Tierra. (Sistemas

Geodésicos. Comité Nacional de la Unión Geodésica y Geofísica Internacional .1era edición 1999)

2.4.3 International Terrestrial Reference Frame (ITRF).

El organismo encargado de determinar y entregar información científica sobre


los parámetros de orientación de la tierra, para la realización de distintos
organismos (astronómicos, geodésicos y geofísicos), es el IERS (Internacional
Earth Rotation Service). ITRF fue establecido por IERS y constituye el marco de
17

referencia del ITRS (Internacional Earth Reference System). Existe alguna


confusión entre los conceptos de sistemas y marcos de referencia. Los
sistemas de referencia se definen a partir de consideraciones matemáticas y
físicas e involucran la especificación de parámetros, puntos origen, planos, ejes,
etc. Los marcos de referencia están constituidos por puntos materializados en el
terreno, ubicados con gran exactitud y precisión, según alguno de los sistemas
de referencia.

La constitución del ITRF corresponde a un conjunto de estaciones de las cuales


se conocen sus coordenadas y su variación respecto al tiempo, a las cuales se
les denomina Set of Station Coordinates (SSC). Para ello se emplean técnicas
como VLBI (Very Long Baseline Interferometry), SLR (Satelite Laser Ranging),
LLR (Lunar Laser Ranging), GPS, DORIS (Doppler Orbitography and Radio-
positoning Integrated by Satellite)

Figura 2.5 Estaciones ITRF2005.


Fuente: http://itrf.ensg.ign.fr/
18

Figura 2.6. Movimiento de las placas terrestres obtenido por ITRF2005 (1 cm/año).
Fuente: http://itrf.ensg.ign.fr/

2.4.4 Sistema WGS-84.

El sistema Geodésico Mundial 1984, es actualmente el sistema de referencia


para GPS y es compatible con el ITRF, básicamente bajo los siguientes
aspectos:

• Posición: geocéntrico, con origen en el centro de masa de la tierra,


incluyendo océanos y atmósfera.
• Orientación: eje Z en dirección del Polo de Referencia definido por IERS,
eje X en la intersección del meridiano de Referencia (IERS) y el plano
ecuatorial, eje Y completa el sistema ortogonal dextrógiro.

Al sistema cartesiano se asigna un elipsoide también denominado WGS-84, que


es compatible con el sistema de referencia 1980 (Elipsoide GRS80).
19

Figura 2.7. Parámetros WGS 84.


Fuente: Manual de carreteras Volumen II

2.4.5 Sistema de referencia para las Américas (SIRGAS).

El sistema de referencia geocéntrico para las Américas (SIRGAS) es la


densificación regional del marco global de referencia terrestre del IERS (ITRF).
Las coordenadas SIRGAS están asociadas a una época específica de
referencia y su variación con el tiempo es tomada en cuenta ya sea por las
velocidades individuales de las estaciones SIRGAS o mediante un modelo
continuo de velocidades que cubre todo el continente. Además del sistema de
referencia geométrico, se ocupa de la definición y realización de un sistema
vertical de referencia basado en alturas elipsoidales como componente
geométrica y en números geopotenciales (referidos a un valor W0 global
convencional) como componente física. Las realizaciones o densificaciones de
SIRGAS asociadas a diferentes épocas materializan el mismo sistema de
referencia y sus coordenadas, reducidas a la misma época, son compatibles en
el nivel milimétrico.

La primera realización de SIRGAS (SIRGAS95) corresponde al ITRF94, época


1995.4 y está dada por una red GPS de alta precisión con 58 estaciones
distribuidas sobre América del Sur. Esta red fue reocupada en el año 2000,
extendiéndose a los países del Caribe y de Centro y Norte América. Por esta
razón, el significado original del acrónimo SIRGAS (Sistema de Referencia
Geocéntrico para América del Sur) cambió a Sistema de Referencia
Geocéntrico para las Américas. La nueva realización de SIRGAS
(SIRGAS2000) incluye 184 estaciones y corresponde al ITRF2000, época
20

2000.4. La precisión de las coordenadas de estas dos realizaciones está entre


±3 y ±6mm (Grupo II de Trabajo SIRGAS) La tercera realización de SIRGAS es
la red SIRGAS de Observación Continua (SIRGAS-CON). Actualmente está
compuesta por aproximadamente 130 estaciones GNSS de funcionamiento
permanente, de las cuales aproximadamente 50 pertenecen la red global del
IGS (International GNSS Service).

2.5 SISTEMA DE POSICIONAMIENTO GLOBAL (GPS)

El GPS (Global Positioning System, o sistema de posicionamiento Global) fue


desarrollado por el Departamento de Defensa de los Estados Unidos (DoD)
como un sistema de navegación de precisión, con fines militares. A partir de
1973 se comenzó a desarrollar la constelación NAVSTAR (Navigation Satellite
Timing and Ranging o Navegación por satélite con medición de tiempo y
distancia), la cual quedó operativa en 1995, conformada por 27 satélites (24
operativos y 3 de reserva), dando un alto grado de disponibilidad al sistema
GPS en todo momento del día y en cualquier lugar.

El sistema GPS esta referido al datum WGS-84 y tiene por objetivo calcular la
posición de un punto cualquiera en un espacio de coordenadas (X,Y,Z),
partiendo del cálculo de las distancias del punto a un mínimo de tres satélites
cuya localización es conocida. La distancia entre el usuario (receptor GPS) y un
satélite se mide multiplicando el tiempo de vuelo de la señal emitida desde el
satélite por su velocidad de propagación. Para medir el tiempo de vuelo de la
señal de radio es necesario que los relojes de los satélites y de los receptores
estén sincronizados, pues deben generar simultáneamente el mismo código.
Ahora bien, mientras los relojes de los satélites son muy precisos los de los
receptores son osciladores de cuarzo de bajo coste y por tanto imprecisos. Las
distancias con errores debidos al sincronismo se denominan pseudodistancias.
21

La desviación en los relojes de los receptores añade una incógnita más que
hace necesario un mínimo de cuatro satélites para estimar correctamente las
posiciones.

2.5.1 Señal GPS.

Los satélites que utiliza GPS contienen varios osciladores de alta precisión,
entregando medidas de tiempo del orden de 10 −14 segundos. Los osciladores
de alta precisión del satélite tiene una frecuencia fundamental ƒ 0 = 10.23 MHz,

la cual genera dos frecuencias portadoras de la banda L, las cuales sirven para
transmitir información a través de los satélites.

Las dos frecuencias generadas a partir de ƒ 0 son:

• L1 = 1575.42 MHz, con longitud de onda λ=19 cm.


• L2 = 1227.60 MHz, con longitud de onda λ=24 cm.

Sobre estas dos frecuencias transportadoras se transmiten, a su vez, dos


códigos, que son secuencias binarias (combinación de ceros y unos) de
formación seudo aleatoria, llamados Ruidos Seudo Aleatorio-PRN (pseudos
Random Noise), estos códigos son:

• Código binario de adquisición Bruta o Grosera – C/A (Coarse


Adquisition): modulado sólo en L1 y es el de menor frecuencia a 1.023
MHz, su longitud de onda λ es de 300 m. Es de uso civil.
22

• Código binario preciso P (ó Y): modulado en ambas portadoras (L1 y


L2) a una frecuencia de 10.23 MHz, tiene una longitud de onda λ de sólo
30 m. y es de uso Restringido.

Junto con estos dos códigos, se envía un mensaje de navegación (NAVDATA)


modulado en ambas portadoras, el cual suministra la siguiente información:

• Efemérides de los satélites: información que refleja el movimiento del


satélite en su orbita y permite calcular la posición de este al instante de
medición.

• Almanaque: información sobre la posición de todos los satélites de la


constelación.

• Tiempo del sistema.

• Correcciones a los relojes de los satélites.

• Número de identificación del satélite

• Estado (salud) del satélite

2.5.2 Fuentes de error GPS

Igualmente que en todos los equipos que se utilizan, una observación GPS está
sometida a varias fuentes de error, que se pueden minimizar dependiendo del
equipo y metodología que se utilice. Estas fuentes de error son las siguientes:
23

Satélites: -Variaciones Orbitales


-Errores en el oscilador

DoD: -S/A (Disponibilidad Selectiva)

Punto de Referencia: -Error del oscilador receptor


-Error en las coordenadas de referencia
Observaciones: -Retraso Ionosférico.
-Retraso Troposférico.
-Pérdidas de ciclos
-Errores de medida de fase con el receptor en
movimiento.
-Multipath (Ondas reflejadas)
-Errores en el estacionamiento
-Errores en la manipulación del equipo.

2.6 TRANSFORMACION BIDIMENSIONAL DE COORDENADAS.

2.6.1 Tipos de transformaciones bidimensionales.

Las transformaciones bidimensionales se dividen en:

• Proyectiva.
• Afín.
• De Semejanza o conforme.
24

a- Transformación proyectiva bidimensional.

Las ecuaciones de la transformación bidimensional proyectiva posibilitan el


cálculo analítico de coordenadas de puntos del sistema de referencia sobre un
plano (X, Y) a partir de las coordenadas de sus puntos homólogos en el sistema
arbitrario (x´,y´) En estas ecuaciones se supone que la coordenada “Z” del
sistema de referencia es conocida al estar situados los puntos sobre un mismo
plano. En el caso de considerar puntos que no estén contenidos en dicho plano,
los valores de las coordenadas planimétricas (X, Y) que se obtengan, tendrán
un error proporcional al error de la “Z” considerada. Esta transformación suele
emplearse en aquellos casos en los que se suponen pequeñas variaciones de
relieve.

b- Transformación afín bidimensional.

La transformación de coordenadas afín bidimensional, es sólo una pequeña


modificación de la transformación de semejanza (2-D) a la cual se le incluyen
diferentes factores de escala, dirección eje de abscisas y ordenadas, y falta de
ortogonalidad entre sus ejes.

c- Transformación bidimensional conforme o de semejanza.

Una transformación de semejanza aplicada sobre una figura, es aquella que no


varía su verdadera forma después de la transformación. Para aplicar una
transformación bidimensional de semejanza es necesario conocer como mínimo
las coordenadas de dos puntos en ambos sistemas. Se mejora la precisión en
la transformación, si los puntos se eligen lo más alejados posibles. Debido a
que son 4 incógnitas y cada punto entrega 2 ecuaciones, son necesarios al
25

menos 3 puntos para haber redundancia y hacer posible el ajuste con 2 grados
de libertad.

Figura 2.8. Representación grafica de ejes XY girados, trasladados y escalados.


Fuente: “Ajuste Geodésico” Rene Zepeda.

La expresión general de una transformación conforme bidimensional,


considerando el caso más general, es decir, ejes girados, trasladados y con
diferentes unidades de medida, se tendrá:

x' = λ ⋅ ( x ⋅ Cos (ω ) + y ⋅ Sen(ω )) + Tx


y ' = λ ⋅ ( y ⋅ Cos (ω ) − x ⋅ Sen(ω )) + T y

Expresado en forma matricial la expresión anterior se tiene:

⎡ x'⎤ ⎡ Cos (ω ) Sen(ω ) ⎤ ⎡ x ⎤ ⎡Tx ⎤


⎢ y '⎥ = λ ⋅ ⎢− Sen(ω ) Cos (ω )⎥ ⋅ ⎢ y ⎥ + ⎢T ⎥
⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ y⎦

Pudiendo expresar la relación anterior de la siguiente forma:


26

⎡ x'⎤ ⎡ a b ⎤ ⎡ x ⎤ ⎡Tx ⎤
⎢ y '⎥ = ⎢− b a ⎥ ⋅ ⎢ y ⎥ + ⎢T ⎥
⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ y⎦

Esta transformación es conocida con el nombre de Transformación de Helmert.


Donde los parámetros de la transformación a calcular son respectivamente a, b,
Tx, Ty. Conocidos los parámetros a y b puede determinarse el giro y el factor
de escala.

a = λ ⋅ Cos (ω )
b = λ ⋅ Sen(ω )

Con lo que:

λ = a2 + b2
b
ω = A tan( )
a

2.6.2 Modelo de ajuste.

El modelo aplicable para este caso es uno paramétrico con lo que:

La = F(Xa)

Modelo linealizado: AX + L = V

Partiendo de la forma general, las ecuaciones de observación para n puntos


serán:
27

P1 ⇒ x'1 = a ⋅ x1 + b ⋅ y1 + Tx y '1 = a ⋅ y1 − b ⋅ x1 + T y
P2 ⇒ x ' 2 = a ⋅ x 2 + b ⋅ y 2 + Tx y'2 = a ⋅ y 2 − b ⋅ x2 + Ty
M M M
Pn ⇒ x' n = a ⋅ x n + b ⋅ y n + Tx y'n = a ⋅ y n − b ⋅ xn + Ty

De esto se obtiene:
x'1
y '1
a
x' 2
δF b
A= |X X = L = y'2
δX a 0
Tx
M
Ty
x' n
y'n

Donde A se ira conformando de la siguiente manera:

δx' δx' δx' δx'


=x =y =1 =0
δa δb δTx δT y
δy ' δy ' δy ' δy '
=y = −x =0 =1
δa δb δTx δT y

El modelo de Helmert se resolverá por:


28

⎡ δx1 ' δx1 ' δx1 ' δx1 ' ⎤


⎢ δa δb δTx T y ⎥
⎢ ⎥
⎢ δy1 ' δy1 ' δy1 ' δy1 ' ⎥
⎢ δa δb δTx δT y ⎥
x'1 Vx'1
⎢ ⎥
⎢ δx 2 ' δx 2 ' δx 2 ' δx 2 ' ⎥ a y '1 Vy '1
⎢ δa δb δTx T y ⎥ b x' 2 Vx' 2
⎢ δy ' δy 2 ' δx 2 ' δy 2 ' ⎥⎥ ⋅ − y ' 2 = Vy ' 2
⎢ 2 Tx
⎢ δa δb δTx δT y ⎥ M M
⎢ M T
M M M ⎥ y x' n Vx' n
⎢ δx ' δx n ' δx n ' δx n ' ⎥
⎢ n ⎥ y'n Vy ' n
⎢ δa δb δTx Ty ⎥
⎢ δy n ' δy n ' δx n ' δy n ' ⎥
⎢ ⎥
⎢⎣ δa δb δTx δT y ⎥⎦

[A] [X ] [L] [V ]

Donde [A] [X] - [L] = [V] representa la forma general de las ecuaciones de
observación indirecta.

Aplicando la condición de mínimo al sistema de ecuaciones se tiene:

n
Φ = ∑ Vi = [V ] ⋅ [P ] ⋅ [V ]
2 t

i =1
Φ = ([A] ⋅ [X ] − [L ]) ⋅ [P ] ⋅ ([ A] ⋅ [X ] − [L ])
t

Φ = [X] ⋅ [A] ⋅ [P] ⋅ [A] ⋅ [X] - [L]t ⋅ [P] ⋅ [A] ⋅ [X] - [X] t ⋅ [A]t ⋅ [P] ⋅ [L] + [L]t ⋅ [P] ⋅ [L]
t t

2º y 3º término son iguales, por propiedad de matrices, por lo que resulta.

Φ = [X] t ⋅ [A]t ⋅ [P] ⋅ [A] ⋅ [X] - 2 ⋅ [L]t ⋅ [P] ⋅ [A] ⋅ [X] + [L]t ⋅ [P] ⋅ [L]

Para minimizar la función Φ, habrá que calcular su derivada parcial con


respecto a X:
29

δΦ
= 0( Minimo)
δX
δΦ
= 2 ⋅ [X] t ⋅ [A]t ⋅ [P] ⋅ [A] - 2 ⋅ [L]t ⋅ [P] ⋅ [A] = 0
δX
[X] = ( [A]t ⋅ [P] ⋅ [A]) -1 ⋅[A]t ⋅ [P] ⋅ [L]

2.6.3 Precisión del método de ajuste.

2
Lo primero es encontrar la precisión a posteriori del modelo ( 0 ) El parámetro
2
0 normalmente es desconocido y es necesario estimarlo. El estimador de este
parámetro es la varianza residual, definida como el coeficiente entre la suma de
residuos al cuadrado y el número de grados de libertad del modelo.

n
1
sˆ R = ⋅ ∑ vi
2 2

n − u i =1

Donde:

n: Número de observaciones. En este caso particular cada observación que


entra en el modelo debe ser considerada dos veces es decir habrá 2n
observaciones debido a que cada punto de observación entrega dos
educaciones al modelo.

u: Número de parámetros

n –u: Grados de libertad del modelo.

∑v
2
i : Suma de los cuadrados de los residuos.
i =1
30

En forma matricial se podrá estimar a través de.

Lt ⋅ P ⋅ L - X t ⋅ A t ⋅ P ⋅ L
sˆ R =
2

n−u

Asumiendo que sˆ R ≈ σ 0 entonces es posible estimar las matrices de varianza-


2 2

covarianza de:

• Parámetros ajustados:

∑ X a = σ 0 ⋅ At ⋅ P ⋅ A
2
( ) −1

• De los valores observados ajustados:

(
∑ La = σ 0 ⋅ A ⋅ A t ⋅ P ⋅ A
2
)
−1
⋅ At

• De los residuos:

(
∑ V = σ 0 ⋅ ( A ⋅ At ⋅ P ⋅ A
2
)
−1
⋅ A t − P −1 )
31

2.7 INFERENCIA ESTADÍSTICA

2.7.1 Introducción.

En el campo de la estadística se distinguen dos partes, la descriptiva y la


inferencial. La descriptiva intenta resumir en forma concisa, un conjunto de
datos en un solo valor, índice o coeficiente. Por su parte la inferencial trata de
llegar a conclusiones que sobrepasan el alcance de los datos analizados, es
decir se trata de técnicas que tienden a deducir características desconocidas a
partir de un conjunto de datos. (Dr. José Luis Borcosque, Métodos de cuantificación en geografía).

La inferencia estadística está formada por los métodos utilizados para tomar
decisiones o para obtener conclusiones sobre una población, utilizando la
información contenida en una muestra. Se puede dividir en dos grandes áreas:
estimación de parámetros y prueba de hipótesis.

Como la inferencia estadística nos permite trabajar con una variable a nivel de
intervalo o razón, así también se puede comprender la relación de dos o más
variables y nos permitirá relacionar mediante ecuaciones, una variable en
relación de la otra variable llamándose Regresión Lineal y una variable en
relación a otras variables llamándose Regresión múltiple, siendo a esta ultima a
la cual se referirá en este trabajo .

Con regresión múltiple se puede determinar si existe o no relación de


dependencia entre dos o más variables. Es decir, conociendo los valores de
una variable independiente, se trata de estimar los valores de dos o más
variables dependientes, consiguiendo de mejor manera, una función con
parámetros que realmente son influyentes en los resultados.
32

2.7.2 Conceptos básicos de inferencia estadística.

Para que un método de inferencia estadística proporcione buenos resultados


debe:

• Basarse en una técnica estadístico-matemática adecuada al problema y


suficientemente validada.

• Utilizar una muestra que realmente sea representativa de la población y


de un tamaño suficiente.

A continuación se definirán conceptos básicos, para un mejor entendimiento de


la materia, donde algunas posteriormente se mencionarán o explicarán con
mayor profundidad:

• Población: es un conjunto homogéneo de individuos sobre los que se


estudia una o varias características que son, de alguna forma,
observables.

• Muestra: es un subconjunto de la población. El número de elementos de


la muestra se denomina tamaño muestral.

• Muestreo aleatorio simple: es aquel en el que todos los individuos de la


población tienen la misma probabilidad de ser elegidos.

• Muestra aleatoria simple: de una variable aleatoria x , con distribución

F y de tamaño n , es un conjunto de n variables aleatorias x1 , x 2 ,..., x n ,

independientes e igualmente distribuidas (con distribución F ).


33

• Espacio muestral: es el conjunto de muestras posibles que pueden


obtenerse al seleccionar una muestra aleatoria, de tamaño n , de una
cierta población.

• Parámetro: es cualquier característica medible de la función de


distribución de la variable en estudio (media, varianza,…etc.).

• Estadístico: es una función de la muestra T ( x1 , x 2 ,..., x n ). Por tanto, es


una variable aleatoria que tiene una función de distribución que se
denomina distribución en el muestreo de T.

• Distribuciones muéstrales de una estadística: es la distribución de


probabilidad que puede obtenerse como resultado de un número infinito
de muestras aleatorias independientes, cada una de tamaño n
provenientes de la población de interés.

• Estimador de la media poblacional: se utiliza la media muestral


definida por:

1 n
X = Σ xi
n i =1

Si X sigue una distribución normal (obedece campana de Gauss)


N ( µ , σ 2 ) , se verifica que:

⎛ σ2 ⎞ X −µ
X ~ N ⎜⎜ µ , ⎟⎟ ⇔ ~ N (0,1)
⎝ n ⎠ σ/ n
34

• Estimador de la varianza poblacional: se utiliza la cuasivarianza


muestral definida por
1 n
sˆ 2 = Σ( X i − X )2
n − 1 =1
i

Si X sigue una distribución normal N ( µ , σ 2 ) , se verifica que:

(n − 1) sˆ 2
~ χ n2−1
σ 2

Dado que normalmente la varianza poblacional se desconoce y es


necesario estimarla, cuando ocurre esto se utiliza la distribución de la t
(t - Student), que corresponde a una distribución de probabilidad que
surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño (n<30), es de
interés, para la aplicación de este trabajo, el siguiente resultado:

X −µ
~ t n −1
σ/ n

No sé profundizará en todos los tipos de distribución muéstrales existentes en


estadística, debido que no es el fin de este trabajo de tesis, sólo se adjuntarán
en anexos, las tablas normalizadas de cada distribución, de manera que el
lector pueda saber, y a la vez, interpretar de donde se obtienen los valores
normalizados de distribución.
35

2.7.3 Regresión múltiple.

Los Modelos de Regresión estudian la relación estocástica (sistema que


funciona por el azar) cuantitativa entre una variable de interés y un conjunto de
variables explicativas. Sea Y la variable de interés, variable respuesta o
dependiente y sean x1 , x 2 ,...x k las variables explicativas o regresoras. La

formulación matemática de estos modelos es la siguiente:

Y = m( x1 , x 2 ,...x k ) + ε

Donde:

ε = es el error de observación debido a variables no controladas.

En estricto rigor el modelo de regresión es lineal. Por lo tanto la expresión


matemática general del modelo es:

Y = α 0 + α 1 x1 + α 2 + ... + α k x k + ε

Donde como primer objetivo de este modelo es estimar los parámetros


α 0 , α 1 , α 2 ,..., α k y la función de distribución del error F a partir de una muestra
de n observaciones, que tendrá la forma:

{(xri ; yi )}in=1 = {((xi1 , xi 2 ,..., xik ); yi )}in=1

De la expresión matemática general del modelo se deduce que para i = 1,2,...,n


se verifica la siguiente igualdad:
36

y i = α 0 + α 1 xi1 + α 2 xi 2 + ... + α k xik + ε i

Que si se escribe de forma matricial queda:

⎧ y1 = α 0 1 + α 1 x11 + α 2 x12 + K + α k x1k + ε 1 ⎫


⎪ y = α 1+ α x + α x +K + α x + ε ⎪ r
⎪ 2 2⎪ r r
⎬ Î Y = Xα + ε
0 1 21 2 22 k 2k

⎪M M M M M M M⎪
⎪⎩ y n = α 0 1 + α 1 x n1 + α 2 x n 2 + K + α k x nk + ε n ⎪⎭

Desarrollando y resumiendo las matrices del modelo de regresión múltiple son:

⎛ y1 ⎞ ⎛1 x11 x12 K x1k ⎞ ⎛α 0 ⎞ ⎛ε 0 ⎞


⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
r ⎜ y2 ⎟ ⎜1 x 21 x 22 K x 2 k ⎟ r ⎜ α1 ⎟ r ⎜ ε1 ⎟
Y = ⎜ ⎟, X =⎜ , α = ⎜ ⎟, ε =⎜ ⎟
M M M M M M ⎟⎟ M M
⎜ ⎟ ⎜ ⎜ ⎟ ⎜ ⎟
⎜y ⎟ ⎜1 x x K x ⎟ ⎜α ⎟ ⎜ε ⎟
⎝ n⎠ ⎝ n1 n 2 nk ⎠ ⎝ k⎠ ⎝ n⎠

Donde:

r
Y : es un vector n-dimensional (matriz n x 1) de la variable respuesta o
dependiente.

X : es la matriz del diseño de las variables regresoras (matriz n × (k + 1)), la


primera columna de esta matriz está formada por unos, a la columna que se le
asociada con el parámetro α 0 ; la columna j + 1 contiene la información relativa

a la variable xj, con j = 1,2...,k, asociándola al parámetro α j

r
α : es el vector (k + 1)-dimensional (matriz (k+1) × 1) de los parámetros del
modelo.
37

r
ε : es el vector n-dimensional (matriz n x 1) de las perturbaciones aleatorias.

En el estudio del modelo de regresión lineal general se asume que se verifican


las siguientes hipótesis:

1- La función de regresión es lineal.


r r
m( xi ) = m( xi1 , xi 2 ,..., xik ) = E (Y / xi1 , xi 2 ,..., xik ) = E (Y / xi )

= α 0 + α 1 x11 + α 2 x12 + ... + α k x1k , con i = 1,…,n.

2- La varianza es constante.
r
Var (Y / xi ) = Var (Y / xi1 , xi 2 ,..., xik ) = σ 2 , con i = 1,…,n.

3- La distribución es normal.
r
Y / xi = Y / xi1 , xi 2 ,..., xik ~ N(α 0 + α 1 xi1 + α 2 xi 2 + ... + α k x1k , σ 2

4- Las observaciones Yi son independientes (bajo normalidad, esto

equivale a que la Cov (Yi , Y j ) = 0 , si i≠j).

5- n > k + 1. En caso contrario no se dispone de información suficiente para


estimar los parámetros del modelo.

6- Las variables regresoras x1,x2,...,xk son linealmente independientes.

2.7.4 Estimación de los parámetros del modelo.

∧ r
Sea α un estimador del vector de parámetros α . Se define el vector de
predicciones como:
38

Υˆ = Χα̂

El vector de residuos se obtiene como:

r r
e = Υ − Υˆ

r
El estimador por mínimo cuadrados de α se obtiene minimizando la suma de
los residuos al cuadrado. Esto significa, que se minimiza la siguiente función de
k + 1 variables:

n r r r r
Ψ (αˆ ) = Σ ei2 = e t e = (Υ − Υˆ ) t (Υ − Υˆ )
i =1
r r r r
= (Υ − Χαˆ ) t (Υ − Χαˆ ) = (Υ t − αˆ t Χ t )(Υ − Χαˆ )
r r r r
= Υ t Υ − Υ t Χαˆ − αˆ t Χ t Υ + αˆ t Χ t Χαˆ

Derivando respecto a α̂ e igualando a cero, se obtiene las ecuaciones de


regresión:

r
Χ t Υ = Χ t Χα̂ ,

De donde se deduce el siguiente estimador por mínimos cuadrados:

r
α̂ = ( Χ t Χ) −1 Χ t Υ

La matriz Χ t Χ es una matriz (k +1)x(k+1) cuya expresión es la siguiente:


39

⎛ Σ in=11 Σ in=1 xi1 Σ in=1 xi 2 K Σ in=1 xik ⎞


⎜ n ⎟
⎜ Σ i =1 xi1 Σ in=1 xi21 Σ in=1 xi1 xi 2 K Σ in=1 xi1 xik ⎟

Χ t Χ = ⎜ Σ in=1 xi 2 Σ in=1 xi1 xi 2 Σ in=1 xi21 K Σ in=1 xi 2 xik ⎟

⎜ M M M M M ⎟
⎜ n ⎟⎟
⎝ Σ i =1 xik Σ i =1 xik xi1 Σ i =1 xik xi 2 K Σ i =1 xik ⎠
n n n 2

r
La matriz Χ t Υ es una matriz (k+1)x1 que viene dada por:

⎛ Σ in=1 y i ⎞
⎜ ⎟
⎜ Σ in=1 xi1 y i ⎟
r ⎜
Χ t Υ = ⎜ Σ in=1 xi 2 y i ⎟

⎜ M ⎟
⎜⎜ n ⎟
⎝ Σ i =1 xik y i ⎠

2.7.5 Propiedades de los estimadores

a- Estimador de los coeficientes del modelo lineal.

r
En el estimador del vector α , por el método de mínimos cuadrados, se
verifican las siguientes propiedades:

r
• El estimador α̂ es insesgado o centrado: E (αˆ ) = α . El termino insesgado
o centrado viene de la definición de sesgo, que es la diferencia entre el
valor esperado y el valor verdadero del parámetro a estimar. Por lo tanto,
es deseable que un estimador sea insesgado o que su sesgo sea nulo.

• La matriz de varianzas-covarianzas del estimador α̂ es :


40

Var (αˆ ) = E ((αˆ − E (αˆ ))(αˆ − E (αˆ )) t ) = σ 2 ( Χ t Χ ) −1 = (σ ij2 ) ik, j =0 . De donde se

deduce que los estimadores α̂ i y α̂ j (i≠j) no son independientes ya que

σ ij2 = Cov (αˆ i , αˆ j ) ≠ 0 , con i,j=0,1,…,k. En particular, la varianza del

estimador α̂ i viene dada por:

σ ii2 = Cov(αˆ i , αˆ i ) = Var = (αˆ i ) = σ i2 = σ 2 qii , con i=0,1,…,k, siendo qii el

elemento i-ésimo de la matriz ( Χ t Χ) −1 .


• El estimador α̂ tiene distribución normal multivariante de orden k+1, esto
quiere decir :

r
αˆ ~ N (k +1) (α , σ 2 ( Χ t Χ) −1 )

• El estimador α̂ i del parámetro α i tiene la siguiente distribución normal :

αˆ i ~ N(α i , σ 2 qii ) , con i =0,1,…,k.

El parámetro α i indica la influencia de la variable regresora xi en la variable

respuesta Y , además del incremento que se produce en ésta por el


crecimiento unitario en la variable regresora xi . Se debe tener en cuenta

que el valor de α i está condicionado al modelo de regresión múltiple con el

que se está trabajando y si se cambia el modelo (se eliminan o introducen


variables) el coeficiente α i , asociado a la variable regresora xi , también

cambia. Por otro lado aceptar que el valor α i es cero, equivale a aceptar

que la variable xi , no está relacionada linealmente con la variable Y .

Si se conoce la varianza del modelo σ 2 , utilizando las distribuciones


mencionadas anteriormente, se pueden calcular intervalos de confianza de
41

los parámetros α i , individuales o conjuntos (regiones de confianza del

vector parametrito (α j1 , α j 2 ,..., α jh ) , con j1 , j 2 ,..., j h ∈ {0,1,2,..., h} o hacer

contrastes de simplificación sobre parámetros. En la práctica casi nunca se


conoce σ 2 debido a que es la varianza de la población y siempre se hacen
modelos a partir de muestras de la población, por lo tanto la varianza σ 2 es
necesario estimarla.

b- El estimador de la varianza.

Una hipótesis básica del modelo es que los errores son normales y
homocedásticos, por tanto, Var (ε i ) = σ 2 , con i = 1,…,n, el parámetro σ 2

normalmente es desconocido y es necesario estimarlo. El estimador de este


parámetro es la varianza residual, definida como:

1 n
sˆ R2 = Σ ei2
n − (k + 1) i =1

El estimador sˆR2 es distinto del estimador que se obtiene por máxima

verosimilitud, que se denota como σˆ MV


2
y que se define como:

1 n 2
σˆ MV
2
= Σ ei
n i =1

La relación entre ambos estimadores que dada de la siguiente forma:

n
sˆ R2 = σˆ MV
2

n − (k + 1)
42

El estimador sˆR2 tiene la ventaja, respecto a σˆ MV


2
, de ser insesgado.

Utilizando la hipótesis de normalidad se obtiene la siguiente relación que


permite conocer la distribución de sˆR2 :

(n − (k + 1)) s R2
~ χ n2-(k +1)
σ2

De la relación anterior se obtiene un intervalo de confianza de σ 2 con un nivel


de confianza 1 - α , que queda expresado como:

(n − (k + 1)) sˆ R2 (n − (k + 1)) sˆ R2
≤σ ≤
2

⎛ α⎞ ⎛α ⎞
χ n −( k +1) ⎜1 − ⎟ χ n2−( k +1) ⎜ ⎟
⎝ 2⎠ ⎝2⎠

Donde χ n2−( k +1) (θ ) el número que verifica que P (ξ ≤ χ n2−( k +1) (θ )) = θ , siendo ξ

Una variable aleatoria con distribución χ n2−( k +1) .

c- Inferencia sobre los parámetros del modelo.

De la distribución de α̂ i , se deduce:

αˆ i − α i
αˆ i ~ N(α i , σ 2 qii ) ⇒ ~ N(0,1) , con i = 0,1,…,k
σ qii

De sˆR2 y del intervalo de σ 2 la distribución de ω i es t n −( k +1) , o sea:


43

αˆ i − α i
ωi = ~ t n −( k +1) , i=0,1,…,k
σ qii

Utilizando ωi se obtiene que un intervalo de confianza para α i a un nivel de

confianza 1- α es:

⎛ α⎞
α i ∈ αˆ i ± sˆ R qii ⋅ t n −( k +1) ⎜1 − ⎟, con i =0,1,…,k
⎝ 2⎠

Donde t n −( k +1) (θ ) es el número que verifica que P (ζ ≤ χ n2−( k +1) (θ )) = θ , siendo ζ

una variable aleatoria con distribución t n −( k +1) . El estadístico ω i también se

puede utilizar para realizar contrastes de hipótesis acerca de si la variable


explicativa xi influye individualmente o no en la variable respuesta Y (contraste

de simplificación). Aceptar que α i = 0 equivale a aceptar que la variable xi no

está relacionada linealmente con la variable Y , por tanto no debe estar en el


modelo.

d- Contraste individual de la t.

Se desea hacer el siguiente contraste ( Ci ) que verifique el contraste individual

de la t:

⎧ H 0 ≡ α i = 0⎫
Ci ≡ ⎨ ⎬ con i =0,1,…,k
⎩H 1 ≡ α i ≠ 0 ⎭
44

Si H 0 es cierto, se obtiene que:

αˆ i
ω i │ H = tˆi =
0
~ t n −( k +1) , con i=0,1,…,k.
sˆ R qii

tˆi representa la discrepancia entre la información que proporciona la muestra y

la información que proporciona la hipótesis nula ( H 0 ).

Se deduce que el p − valor de este contraste bilateral es:

⎛ αˆ i ⎞
p − valor = 2 P⎜ t n −( k +1) > tˆi = ⎟.
⎜ sˆ R qii ⎟
⎝ ⎠

La región de aceptación del contraste a un nivel de significación α es:

⎛ α⎞ ⎛ α⎞
− sˆ R qii ⋅ t n −( k +1) ⎜1 − ⎟ ≤ αˆ i ≤ sˆ R qii ⋅ t n −( k +1) ⎜1 − ⎟
⎝ 2⎠ ⎝ 2⎠

2.7.6 Análisis de la varianza

En el siguiente apartado se va a explicar como descomponer la variable de


interés Y , cuando se ajusta un modelo de regresión múltiple.

a- Tabla ANOVA.

Para todos los datos muestrales se hace la siguiente descomposición:

( y i − y ) = ( y i − yˆ i ) + ( yˆ i − y )
45

Elevando al cuadrado y sumando se obtiene:

n n n n
Σ ( y i − y ) 2 = Σ ( y i − yˆ i ) 2 + Σ ( yˆ i − y ) 2 + 2 Σ ( y i − yˆ i )( yˆ i − y )
i =1 i =1 i =1 i =1

En base a la ortogonalidad de los vectores se obtiene que los productos


cruzados sean cero, de donde se sigue la siguiente igualdad (Teorema de
Pitágoras) que permite descomponer la variabilidad de la variable respuesta
n n
( Σ ( yi − y ) 2 ) en la variabilidad explicada por la recta de regresión ( Σ ( yˆ i − y ) 2 ),
i =1 i =1

n
más la variabilidad residual o no explicada por el modelo ajustado ( Σ ( yi − yˆ i ) 2 ).
i =1

De esta igualdad se construye la siguiente tabla ANOVA:

Tabla 2.2. Tabla ANOVA del modelo de regresión múltiple

Tabla ANOVA del modelo de regresión múltiple


Fuente de variación Suma de cuadrados Grados de libertad Varianzas
n scE
Por la recta
scE= Σ ( yˆ i − y )
2
sˆe2 =
i =1 k k
n scR
Residual
scR= Σ ( y i − yˆ i )
2
sˆe2 =
i =1 n-(k+1) n − (k + 1)
n scG
Global
scG= Σ ( y i − y )
2
sˆe2 =
i =1 n-1 n −1

De esta tabla ANOVA se deduce el siguiente contraste acerca de la influencia


conjunta del modelo de regresión en la variable respuesta.
46

b- El contraste conjunto de la F.

El contraste se denomina C M y al igual que el contraste de la t, se desea


resolver lo siguiente:

⎧ H 0 ≡ α 1 = α 2 = ... = α k = 0⎫
CM ≡ ⎨ ⎬ , para algún i
⎩H 1 ≡ α i ≠ 0 ⎭

Si H 0 es cierto, ninguna de las variables regresoras influye en la variable

respuesta. En este supuesto se verifica que:

yˆ i ≈ y ⇒ scE ≈ 0 ,

Por ser ésta una medida absoluta se compara con la varianza residual, lo que
lleva a utilizar el siguiente estadístico de contraste:

sˆ 2
FˆM = e2
sˆ R

Bajo la hipótesis nula y por la hipótesis de independencia se sigue que F̂M


sigue una distribución F (contraste de la F) con k y n-(k+1) grados de libertad.
sˆe2
F̂M │ H 0 = 2 ~ Fk ,n −( k +1)
sˆ R

p − valor del contraste es:

p − valor = P ( Fk ,n −( k +1) ≥ FˆM ) ,


47

Donde Fk ,n −( k +1) denota una variable aleatoria que sigue una distribución F con

k y n − (k + 1) . Si el valor critico p − valor del contraste es grande (mayor que el


nivel de significación α ) se acepta H 0 , esto quiere decir, que el modelo de

regresión no es influyente y debe buscarse un modelo alternativo.

c- Contrastes individuales de la F

Al igual que el contraste individual de la t, pero con la diferencia que se utilizará


la tabla ANOVA, se estudiará el incremento que se produce en el modelo al
introducir la variable regresora xi .

Para ello, si se desea contrastar la influencia de la variable xi , primeramente se

ajusta el modelo de regresión completo, con las k variables regresoras,


calculando así, la suma de cuadrados explicada por el modelo (scE(k)). A
continuación, se ajusta el modelo de regresión con k-1 variables, todas excepto
la variable xi . Nuevamente, se calcula la suma de cuadrados explicada por el

este modelo (scE(k- xi )), obteniendo así la suma al cuadrado incremental

debido a xi , como se muestra a continuación:

∆scE ( xi ) = scE (k ) − scE (k − xi ) ≥ 0

Este valor indica el aumento de la variabilidad explicada por el modelo al


introducir la variable xi . Para contrastar la influencia individual o no de xi , se

realiza el siguiente contraste:

⎧ H 0 ≡ α i = 0⎫
Ci ≡ ⎨ ⎬ con i=0,1,…,k.
⎩H 1 ≡ α i ≠ 0 ⎭
48

Como estadístico del contraste se utiliza:

∆scE ( xi )
Fˆi = 1 , con i=0,1,…,k.
sˆ R2 (k )

Bajo la hipótesis nula se verifica que F̂i sigue una distribución F (contraste

individual de la F) con 1 y n – (k+1) grados de libertad.

F̂i │ H 0
~ F 1 , n − ( k + 1 ) , con i=0,1,…,k.

Evidentemente, si H 0 es cierto, ∆scE ( xi ) ≈ 0 y F̂i tomará valores pequeños. Por

lo tanto este contraste unilateral siendo el p − valor del contraste:

p − valor = P ( F1,n −( k +1) ≥ Fˆi , con i=0,1,…,k.

Este contraste proporciona exactamente el mismo resultado que el contraste


individual de la t. Sin embargo, este método presenta la ventaja adicional de
poder utilizarse para contrastar la influencia de un subconjunto de l variables
explicativas, con l ≤ k , {x j , x j 2 ,..., x jl }. En este caso el estadístico del contraste

utilizado es:

∆scE (l )
Fˆl = 2 l ~ Fl ,n −( k +l )
sˆ R (k )

De esta manera en el modelo de regresión múltiple al hacer el contraste entre


la influencia individual de cada una de las variables regresoras y el contraste
49

sobre la influencia conjunta del modelo de regresión ajustado, se dan diversos


resultados significativos o no, pudiendo eliminar variables o agregar otras, para
así obtener un resultado más óptimo.

2.7.7 Correlación.

Al ajustar un modelo de regresión múltiple a una nube de observaciones es


importante disponer de alguna medida que permita medir la bondad del ajuste.
Esto se consigue con los coeficientes de correlación múltiple.

a- Coeficiente de correlación múltiple.

Se define el coeficiente de correlación lineal simple (o de Pearson) entre dos


variables X e Y , como:

s ( x, y )
r( X ,Y ) =
sx ⋅ s y

Donde:

s ( x, y ) : Covarianza muestral entre las variables X e Y .


s x : Desviación típica muestral X .

s y : Desviación típica muestral Y .

El coeficiente de correlación lineal simple es una medida de la relación lineal


existente entre las variables X e Y . En general, cuando se ajusta un modelo
estadístico a una nube de puntos, existe una medida de la bondad del ajuste, la
que se denomina coeficiente de determinación. Está definido por:
50

scE iΣ=1( yˆ i − y )
2

R =
2
=
scG Σn ( y − y ) 2
i
i =1

El coeficiente de correlación múltiple queda definido de igual forma que el


coeficiente de correlación lineal ( R ), representando así, el porcentaje de
variabilidad de la Y que explica el modelo de regresión.

Como scE ≤ scG , se verifica que 0 ≤ R 2 ≤ 1 . Si R 2 = 1, la relación lineal es


exacta y si R 2 =0, no existe relación lineal entre la variable respuesta y las
variables regresoras.

El coeficiente de correlación múltiple presenta el inconveniente de aumentar


siempre que aumenta el número de variables regresoras, ya que al aumentar k
(número de variables regresoras) disminuye la variabilidad no explicada,
algunas veces de forma artificial, lo que puede ocasionar problemas de
multicolinealidad. Si el número de observaciones n es pequeño, el
coeficiente R 2 es muy sensible a los valores de n y k. En particular, si n = k + 1
el modelo se ajusta exactamente a las observaciones. Por ello y con el fin de
penalizar el número de variables regresoras que se incluyen en el modelo de
regresión, es conveniente utilizar el coeficiente de determinación corregido por
el número de grados de libertad ( R 2 ). Este coeficiente es similar al anterior,
pero utiliza el cociente de varianzas en lugar del cociente de sumas de
cuadrados. Para su definición se tiene en cuenta que:

scE scR
R2 = = 1−
scG scG
51

Cambiando las sumas de cuadrados por varianzas se obtiene el coeficiente de


determinación corregido por el número de grados de libertad, R 2 , definido como
sigue:

1 n
Σ ei2
sˆ 2
n − (k + 1) i =1
R 2 = 1 − R2 = 1 −
sˆY 1 n
Σ ( yi − y ) 2
n − 1 =1
i

Se deduce la relación entre los dos coeficientes de correlación, quedando:

n −1
R 2 = 1 − (1 − R 2 ) ⇒ R 2 ≤ R2
n − (k + 1)

También se puede relacionar el estadístico del contraste de regresión múltiple


(de la F) con el coeficiente de determinación, obteniendo:

sˆ 2 R 2 [n − (k + 1)]
FˆM = e2 =
2

sˆ R 1 − R 2 [k ]

b- Correlación parcial.

Sea {X 1 , X 2 ,..., X k } un conjunto de variables aleatorias, se define el coeficiente

de correlación parcial entre xi y x j , como la medida de la relación lineal entre

las variables xi y x j una vez que se ha eliminado en ambas variables los

efectos debidos al resto de las variables del conjunto {X 1 , X 2 ,..., X k } . Al

coeficiente de correlación parcial, entre x1 y x 2 se le denotará como r12⋅3...k .


52

En el modelo de regresión múltiple:

Y = α 0 + α 1 X 1 +α 2 X 2 + ... + α k X k + ε

Se calcula el coeficiente de correlación parcial entre la variable respuesta Y y


una variable regresora xi , controlado por el resto de variables. Para ello se

utiliza el estadístico del contraste individual de la t, respecto a la variable xi y

que se definió anteriormente como:

αˆ i αˆ i
tˆi = = , con i=1,2,…, k.
σ (αˆ i ) sˆ R qii

Obteniéndose la siguiente relación:

tˆi2
rYi2⋅C =
tˆi2 + n − (k + 1)

Donde C= {1,2,..., i − 1, i + 1,..., k } es el conjunto de índices de todas las variables


regresoras excepto el índice i .
53

CAPITULO III – DESARROLLO.

3.1 INTRODUCCION.

En este capítulo se desarrollarán dos aplicaciones de regresión múltiple. En la


primera se analizará un área determinada en la Región Metropolitana y en la
segunda, una línea de nivelación en la cuesta Lo Prado. En ambos casos se
verificará el comportamiento de cada modelo, de tal manera que estos
entreguen resultados óptimos. Los datos utilizados para las dos aplicaciones
que se desarrollarán están en el datum WGS84, con proyección cartográfica
UTM huso 19. Las alturas ortométricas utilizadas están referidas al nivel medio
del mar.
Antes de comenzar con los respectivos desarrollos, es de utilidad tener una
idea del tipo de relación, ya sea lineal o de otro tipo entre las variables que se
van a utilizar (figura 3.1).

Figura 3.1. Relación entre variables.


Fuente: Elaboración propia.
54

3.2 APLICACION1: USO DE REGRESIÓN MÚLTIPLE EN UNA ZONA DE LA


REGIÓN METROPOLITANA.

Se dispone un set de datos de una zona dentro de la región metropolitana de


aproximadamente 100km 2 , abarcando parcialmente comunas como La Reina,
Peñalolén, San Joaquín, Macul, Ñuñoa y Santiago. El set de datos contiene 9
puntos, en donde a cada punto se le conoce su coordenada Norte, Este, Atura
ortométrica (H), y, ondulación geoidal (N) obtenida del modelo geoidal global
EGM96. Se procede al cálculo de la altura elipsoidal (h) para cada punto del set
de datos, mediante la siguiente expresión:

h=H+N

Obteniendo las alturas elipsoidales, los datos que se utilizarán para realizar el
modelo matemático, son los siguientes:

Tabla 3.1. Puntos del Set de datos a utilizar aplicación 1.

Punto Este Norte h H

A 348469.940 6299282.800 621.98 595.000

B 358468.010 6299297.100 826.774 799.000

C 358473.370 6289284.640 977.703 950.000

D 348472.120 6289282.720 615.877 589.000

1 353485.610 6294669.190 628.314 601.000

6 350475.920 6297045.920 607.102 580.000

7 356542.850 6297045.210 687.588 660.000

8 356553.000 6291499.060 760.546 733.000

9 350472.620 6291512.080 609.048 582.000


55

Los puntos del set de datos están dispuestos geográficamente según muestra
la figura 3.2.

La construcción de las matrices, que se utilizarán para la confección del modelo


de regresión múltiple, será en base a la reducción de cada una de las variables
a un centroide, que se obtiene mediante la media de las variables Norte, Este y
altura elipsoidal (h)

Figura 3.2. Puntos dispuestos geográficamente aplicación 1.


Fuente: Elaboración propia.

La media de la variable “H” nos permite comprobar si el modelo está


correctamente realizado. El significado del término libre (o constante) que se
introduce dentro de los cálculos matriciales del modelo de regresión, es
entregar, el valor de la variable respuesta en el punto de origen.

Tabla 3.2. Coordenadas Centroide aplicación 1.

Punto Este Norte h H


Centroide 353490.382 6294324.302 703.8813 676.556
56

3.2.1 Obtención de los coeficientes del modelo.

La función de regresión tendrá la siguiente forma:

H = α 0 + α 1 (E − E ) + α 2 (N − N ) + α 3 (h − h )
m m m

Las matrices que se desarrollan, para la obtención del modelo de regresión,


quedan de la siguiente forma:

⎛ 595 ⎞ ⎛1 - 5020.442 4958.498 - 81.901 ⎞


⎜ ⎟ ⎜ ⎟
⎜ 799 ⎟ ⎜1 4977.628 4972.798 122.893 ⎟
⎜ 950 ⎟ ⎜1 4982.988 - 5039.662 273.822 ⎟
⎜ ⎟ ⎜ ⎟
⎜ 589 ⎟ ⎜1 - 5018.262 - 5041.582 - 88.004 ⎟
r
Y = ⎜⎜ 601 ⎟⎟ , X = ⎜⎜1 - 4.772 344.888 - 75.567 ⎟

⎜ 580 ⎟ ⎜1 - 3014.462 2721.618 - 96.779 ⎟
⎜ ⎟ ⎜ ⎟
⎜ 660 ⎟ ⎜1 3052.468 2720.908 - 16.293 ⎟
⎜ 733 ⎟ ⎜1 3062.618 - 2825.242 56.665 ⎟
⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ 582 ⎠ ⎝1 - 3017.762 - 2812.222 - 94.833 ⎠

Donde:

r
Y : corresponde a la matriz de la variable respuesta o dependiente, que en este
caso es la de alturas ortométricas.

X : es la matriz de diseño de las variables regresoras (matriz n × (k + 1)).

La obtención de los estimadores o coeficientes del modelo se realiza a través


de:
57

⎛α 0 ⎞
⎜ ⎟
r ⎜ α1 ⎟ r
α = ⎜ ⎟ = ( Χ t Χ) −1 Χ t Υ
α
⎜ 2⎟
⎜α ⎟
⎝ 3⎠

r
Con la multiplicación matricial para obtener α , se obtienen los estimadores del
modelo, quedando de la siguiente forma:

H = 676.556 + -7.673E - 05(E − E ) + -9.890E - 06(N − N ) + 9.998E − 01(h − h )


m m m

La varianza residual se obtiene de:

1 n (0.0001)
sˆ R2 = Σ ei2 = = 3.548E - 05 ⇒ sˆ R = 0.004
n − (k + 1) i =1 9 - (3 + 1)

Como se muestra a continuación, de la matriz de varianza-covarianza del


modelo, se obtienen las correspondientes varianzas para cada estimador:

⎛ 0.111 2.218E - 19 - 4.950E - 20 - 6.767E - 18 ⎞


⎜ ⎟
⎜ 2.218E - 19 2.688E - 08 - 5.551E - 09 - 7.590E - 07 ⎟
Var (αˆ ) = 0.000016 ⋅ ⎜
- 4.950E - 20 - 5.551E - 09 9.211E - 09 2.152E - 07 ⎟
⎜ ⎟
⎜ - 6.767E - 18 - 7.590E - 07 2.152E - 07 2.942E - 05 ⎟
⎝ ⎠

q00 = 0.111
q11 = 2.688 E − 08
q22 = 9.211E − 09
q33 = 2.942 E − 05
58

Donde la varianza de cada estimador queda definida por:

sˆ R2 (α i ) = sˆ R2 ⋅ qii

Resultando la siguientes varianzas para cada estimador:

sˆ R2 (α 0 ) = 1.774E - 06 → sˆ R (α 0 ) = 0.001

sˆ R2 (α 1 ) = 4.293E - 13 → sˆ R (α 1 ) = 6.552E - 07

sˆ R2 (α 2 ) = 1.471E - 13 → sˆ R (α 2 ) = 3.835E - 07

sˆ R2 (α 3 ) = 4.699E - 10 → sˆ R (α 3 ) = 2.168E - 05

3.2.2 Intervalos de confianza.

Se procede al cálculo de los intervalos de confianza a un 90% para cada

estimador, incluyendo el de σ 2 , ya que este ultimo obedece a la varianza


residual de una población total, cuestión que en la practica nunca se tiene,
debido a que siempre se trabaja con muestras en donde se hace referencia a la

varianza residual sˆ R2 , pero que sin lugar a dudas, es necesario tener en cuenta.

El cálculo de intervalos de confianza se hace a través de tablas de distribución


estadística (Tablas presentes en ítem Anexos) en el caso de σ 2 , se utilizará
χ n2−( k +1) (también denominada ji-cuadrado) y para el caso de cada uno de los

estimadores se utilizará la distribución de t n −( k +1) (t-student).

• Para σ 2 se tiene que:


59

(n − (k + 1)) sˆ R2 (n − (k + 1)) sˆ R2
≤σ2 ≤
⎛ α⎞ ⎛α ⎞
χ n−( k +1) ⎜1 − ⎟ χ n2−( k +1) ⎜ ⎟
⎝ 2⎠ ⎝2⎠

(9 − (3 + 1))1.597E - 05 (9 − (3 + 1))1.597E - 05
≤σ 2 ≤
χ (25) (0.95) χ (25) (0.05)

Por lo tanto:

7.210E - 06 ≤ σ 2 ≤ 6.973E - 05 ⇒ 0.003 ≤ σ ≤ 0.008

Para cada estimador se tiene que:

αˆ i − α i
ωi = ~ t n −( k +1)
S R qii

Por lo tanto, los intervalos de confianza de cada estimador, quedarán de la


siguiente manera:

• Para α 0:

676.556 − α o
~ t5
0.004 0.111

676.553 ≤ α o ≤ 676.558

• Para α 1( Este) :
60

- 7.673E - 05 − α 1
~ t5
0.004 2.688E - 08

7.810E - 05 ≤ α1 ≤ -7.541E - 05

• Para α 2( Norte) :

- 9.890E - 06 −α 2
~ t5
0.004 9.211E - 09

1.066E - 05 ≤ α 2 ≤ -9.117E - 06

• Para α 3(h) :

9.998E - 01 − α 3
~ t5
0.004 2.942E - 05

9.997E - 01 ≤ α 2 ≤ 9.998E - 01

3.2.3 Contrastes individuales de la t para los coeficientes del modelo de


regresión.

A partir de los valores resultantes de los correspondientes contrastes


individuales de la t, para cada coeficiente, se obtiene que:

• Para α 0:
61

⎧ H 0 ≡ α 0 = 0⎫ αˆ i
C0 ≡ ⎨ ⎬ ⇒ Sí H 0 es cierto, tˆi = ~ t n −( k +1)
⎩H 1 ≡ α 0 ≠ 0 ⎭ sˆ R qii

En donde:

αˆ 0 676.556
tˆ0 = ~ t (5) ⇒ tˆ0 = =507912.714
sˆ R q 00 0.004 0.111

Por lo tanto para α 0:

p − valor = 0

• Para α 1:

⎧ H 0 ≡ α 1 = 0⎫ αˆ i
C1 ≡ ⎨ ⎬ ⇒ Si H 0 es cierto, tˆi = ~ t n −( k +1)
⎩H1 ≡ α1 ≠ 0 ⎭ sˆ R qii

En donde:

αˆ 1 - 7.673E - 05
tˆ1 = ~ t ( 5) ⇒ tˆ1 = = -1.171E+02
sˆ R q11 0.004 2.688E - 08

Por lo tanto para α 1:

p − valor = 0 ⇒ La variable “Este” influye y explica el


comportamiento de la variable respuesta “Altura Ortométrica”.
62

• Para α 2:

⎧ H 0 ≡ α 2 = 0⎫ αˆ i
C2 ≡ ⎨ ⎬ ⇒ Si H 0 es cierto, tˆi = ~ t n −( k +1)
⎩H1 ≡ α 2 ≠ 0 ⎭ sˆ R qii

En donde:

αˆ 2 - 9.890E - 06
tˆ2 = ~ t (5) ⇒ tˆ2 = = -2.579E+01
sˆ R q 22 0.004 9.211E - 09

Por lo tanto para α 2:

p − valor = 0 ⇒ La variable “Norte” influye y explica el


comportamiento de la variable respuesta “Altura Ortométrica”.

• Para α 3:

⎧ H 0 ≡ α 3 = 0⎫ αˆ i
C3 ≡ ⎨ ⎬ ⇒ si H 0 es cierto, tˆi = ~ t n −( k +1)
⎩H1 ≡ α 3 ≠ 0 ⎭ sˆ R qii

En donde:

αˆ 3 9.998E - 01
tˆ3 = ~ t (5) ⇒ tˆ3 = = 4.613E+04
sˆ R q33 0.004 2.942E - 05

Por lo tanto para α 3:


63

p − valor = 0 ⇒ La variable “Altura elipsoidal (h)” influye y explica


el comportamiento e la variable respuesta “Altura Ortométrica”.

En otras palabras, el valor que se obtiene de p − valor es una probabilidad de


influencia de la variable regresora en la variable respuesta. Por lo tanto se tiene,
en los 4 coeficientes, un 0% de probabilidad de que la variable regresora no
influya ni explique, el comportamiento de la variable respuesta Altura
Ortométrica.

3.2.4 Tabla ANOVA (contraste conjunto de la F)

Se construye una tabla de análisis de varianza (ANOVA) utilizando la


distribución de probabilidad de Fisher (F) ya que esta analiza simultáneamente
varias medias poblacionales. Todo esto para verificar la influencia, o no, del
modelo en la variable respuesta, esta tabla queda de la siguiente forma:

Tabla 3.3 .Tabla ANOVA del contraste conjunto de la F aplicación 1.

TABLA ANOVA
Fuentes de Grados de
variación Suma de cuadrados libertad Varianzas
Por el modelo 131514,222 3 43838,074
Residual 7,984E-05 5 1,597E-05
Global 131514,222 8 16439,278

Con estos datos se obtiene el siguiente estadístico del contraste conjunto de la


F:

sˆ 2 43838.074
FˆM = e2 ~ Fk ,n −( k +1) ⇒ FˆM = = 2745239225.676 ~ F3,5
sˆ R 1.597E - 05
64

Por lo tanto:

p − valor = 0 ⇒ Se rechaza la NO influencia del modelo en la variable respuesta.


En base a los resultados de los contrastes individuales de la t y el contraste
conjunto de la F se deduce la influencia de cada una de las tres variables
regresoras y la influencia conjunta del modelo de regresión en la variable de
interés (Altura ortométrica).

3.2.5 Coeficientes de determinación y de correlación del conjunto.

Una vez ajustada la recta de regresión a la nube de observaciones es


importante disponer de una medida que mida la bondad del ajuste realizado y
que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos
alternativos. Como medida de bondad del ajuste se utiliza el coeficiente de
determinación, definido como sigue:

scE 131514.2221
R2 = = = 0.9999
scG 131514.2222

El modelo ajustado explica el 99.99% de la variabilidad de la respuesta.

El coeficiente de correlación múltiple: R = 1

El coeficiente de determinación corregido por los grados de libertad:

sˆ R2 1.597E - 05
R 2 = 1− 2
= 1− ⇒ R 2 = 0.9999
sˆY 16439.278
65

Por lo tanto el coeficiente de correlación corregido por los grados de libertad,


es:
R =1

3.2.6 Coeficientes de determinación y correlación individuales.

Se determinan los coeficientes de correlación y por ende los de determinación,


mediante la siguiente expresión:

Cov( x, y )
R( X , Y ) =
sx ⋅ s y

A modo de ejemplo, sólo se determinará el coeficiente de correlación y


determinación individual de la variable “Este” respecto a la variable dependiente
“Altura ortométrica”, a través de la tabla ANOVA, como un método opcional para
determinar dichos coeficientes.

• Se calcula la regresión de “Este” respecto al “Altura Ortométrica” y se


obtiene la siguiente tabla ANOVA :

Tabla 3.4. Tabla ANOVA de variable “Este” respecto variable “Altura ortométrica

Tabla ANOVA
Fuentes de Suma de Grados de Varianzas
variación cuadrados libertad
Por el modelo 90515.139 1 90515.139
Residual 40999.083 7 5857.012
Global 131514.222 8 16439.278

R 2 = 0.688 R = 0.830
66

Tabla 3.5. Coeficientes de correlación y determinación individuales.

Coeficientes de determinación y correlación.


variable variable Desv. Desv.
1 2 (variable1) (variable2) Cov. R R2
Este Hort 3899.940 120.883 391108.574 0.830 0.688
Norte Hort 3814.464 120.883 -106622.258 -0.231 0.053
helip Hort 121.143 120.883 14644.066 1.000 1.000
Este Norte 3899.940 3814.464 -2233,834783 0.000 0.000
Este helip 3899.940 121.143 392340,418 0.830 0.690
Norte helip 3814.464 121.143 -106496,121 -0.230 0.053

3.2.7 Aplicación del Modelo.

A continuación se aplicará el modelo desarrollado anteriormente a los mismos


puntos con los cuales se realizó la regresión múltiple, obteniendo los siguientes
resultados:

Tabla 3.6. Alturas Ortometricas obtenidas con regresión múltiple.

Punto H(regre)
A 595.004
B 798.997
C 949.999
D 589.001
1 600.998
6 579.997
7 660.004
8 733.004
9 581.997

El vector de los residuos, matricialmente, se obtiene de la siguiente forma:

r r r r r
e = Y − Yˆ = Y − Xαˆ = Y − X ( X t X ) −1 X t Y
67

r
Como Yˆ = HY , siendo H = X ( X t X ) −1 X t la matriz de proyección ortogonal.

En base a esto:

r r r r r r r
e = Y − Yˆ = Y − HY = ( I − H )Y = ( I − H )( Xα + ε )
r r r r r r
e = Xα + ε − HXα − Hε = ( I − H )ε

Se calcula la matriz de varianzas de los residuos,

r rr
Var (e ) = ( I − H ) E (ε ε t )( I − H ) t = σ 2 ( I − H )( I − H ) t = σ 2 ( I − H )

Por tanto, ei es una variable aleatoria con distribución.

ei ~ N(0, σ 2 (1 − hii ), con i=1,…,n.

r r
Donde hii es el valor de influencia de xi que mide la “distancia estadística” de xi

a x . Un residuo “grande” indica que la observación está lejos del modelo


estimado, por lo tanto, la predicción de esta observación es mala. Las
observaciones con residuos grandes se denominan observaciones atípicas o
heterogéneas.

Como los residuos tienen varianza variable y son dimensionados (tienen las
unidades de la variable respuesta “H”), normalmente se tipifican de la siguiente
manera:

ei
, con i=1,…,n.
σ 1 − hii
68

Los residuos tipificados siguen una distribución normal estándar, pero como
σ 2 es desconocido, se sustituye por su estimador la varianza residual s R2
obteniendo así, los residuos estandarizados definidos como:

ei
ri = , con i=1,…,n.
sˆ R 1 − vii

Los residuos estandarizados tienen media cero y varianza próxima a 1, esto


permite distinguir a los residuos grandes.

Por la hipótesis de normalidad los residuos estandarizados siguen una


distribución t con n − (k + 1) grados de libertad. Se obtienen del calculo del
estimador sˆ R (i ) para cada i, i = 1,...,n, la varianza residual del modelo de
regresión obtenido a partir de la muestra en la que se ha eliminado la
r
observación ( xi , Yi ) . Ahora se definen los “residuos estudentizados” como

ei
ti = ~ t ( n −1) −( k +1) con i = 1,…,n.
sˆ R (i ) 1 − vii

Los residuos estudentizados siguen una distribución t con (n − 1) − (k + 1)


grados de libertad. Si el tamaño muestral (n) es grande, los residuos
estandarizados y los estudentizados son casi iguales y muy informativos,
pudiéndose considerar grandes los residuos estandarizados tales que ri > 2.
69

En la tabla 3.7, se encuentran los residuos obtenidos por el modelo.

Tabla 3.7. Residuos simples, estandarizados y estudentizados Aplicación 1.

Residual Residuos Residuos


Punto simple estandarizados estudentizados
A 0.004 1.769 1.971
B -0.003 -1.144 -1.225
C -0.001 -0.321 -0.321
D 0.001 0.239 0.239
1 -0.002 -0.684 -0.709
6 -0.003 -0.973 -1.052
7 0.003 1.225 1.352
8 0.004 1.134 1.253
9 -0.003 -0.808 -0.849
Promedio=0.049
Varianza=1.050

Con los residuos estandarizados o estudentizados se pueden construir los


siguientes gráficos de interés que sirven para verificar si los resultados del
modelo son favorables:

• El histograma de los residuos, que sirve para observar la existencia de


normalidad, simetría y detectar observaciones atípicas
70

2.000

1.500

Residuos estandarizados
1.000

0.500

0.000
A B C D 1 6 7 8 9

-0.500

-1.000

-1.500

Gráfico 3.1.Histograma de residuos (Aplicación 1).


Fuente: Elaboración propia

• El gráfico probabilístico de normalidad (p-p y q-q) y simetría, que


permite contrastar la normalidad (simetría) de la distribución de los
residuos.

0
-1 0 1

Residuos estandarizados

Gráfico 3.2. Probabilístico de normalidad (p-p y q-q) y simetría.


Fuente: Elaboración propia
71

• El gráfico de residuos ( ei ) frente a las predicciones ( ŷi ), que permite

detectar diferentes problemas:

1. Heterocedasticidad: significa que la varianza no es constante,


teniéndose que transformar los datos (de la variable dependiente)
o aplicar mínimos cuadrados ponderados.

2. Error en el análisis: se ha realizado mal el ajuste y se verifica


que los residuos negativos se corresponden con los valores
pequeños ŷi y los errores positivos se corresponden con los

valores grandes de ŷi , o al revés.

3. El modelo es inadecuado: por falta de linealidad y se deben de


transformar los datos o introducir nuevas variables que pueden ser
cuadrados de las existentes o productos de las mismas. O bien se
deben introducir nuevas variables explicativas.

4. Existencia de observaciones atípicas o puntos extremos.

Tener en cuenta que se debe utilizar el gráfico de residuos


( ei ) frente a las predicciones ( ŷi ) en lugar del gráfico de residuos
r
( ei ) frente a las observaciones ( yi ) porque las variables e e
r r
Y están correlacionadas, mientras que las variables e e Yˆ no lo
están.
72

Residuos estandarizados
1

-1

-2
500 600 700 800 900 1000

Predicciones

Grafico 3.3. Residuos estandarizados v/s Predicciones (aplicación 1)


Fuente: Elaboración propia

1000

900
Predicciones

800

700

600

500
500 600 700 800 900 1000

Variable respuesta

Grafico 3.4. Predicciones v/s Variable respuesta (aplicación 1)


Fuente: Elaboración propia

Del grafico 3.4 se infiere un ajuste razonable, debido a que las predicciones
están próximas a los valores observados y en el grafico 3.3 el comportamiento
de los residuos es el adecuado, no tendiendo a ninguna función matemática.
Con estos resultados, más los obtenidos en los contrastes individuales de la t,
Contraste conjunto de la F, coeficientes de determinación y correlación, se
determina que no es necesario incluir ni quitar ninguna variable para el modelo
de regresión múltiple realizado para la aplicación 1.
73

3.2.8 Calibración Local GPS de la zona de estudio Región Metropolitana


con Software Trimble Geomatics Office (TGO)

Con el fin de analizar los resultados del modelo de regresión múltiple, se


realizará un ajuste vertical, mediante el software TGO.

Ingresando al software, antes de importar los datos GPS de la zona en estudio,


se configuran las propiedades del proyecto. De esta manera, el programa
queda preparado para recibir la información según el datum y proyección
correspondiente a los datos a importar.

Figura 3.3. Propiedades del proyecto en software TGO


Fuente: TGO

Los datos fueron importados en formato .csv con las siguientes características
Nombre, Latitud, Longitud, Altura, Código (WGS84)
74

Figura 3.4. Datos importados TGO (aplicación 1)


Fuente: TGO

Luego se procede a realizar una calibración local vertical para la interpolación


de ondulaciones geoidales a través de un plano que se ajuste a los datos
importados.

TGO aplica la siguiente relación para el cálculo de ondulaciones geoidales.

N = a1 + a 2 (ϕ − ϕ m ) + a3 cos ϕ m (λ − λm )

Con lo que idealmente se esta aplicando sobre el punto medio de la zona de


ajuste (φm, λm), un desplazamiento constante sobre la vertical y dos giros en
las direcciones de los ejes coordenados, uno en la dirección S-N y otro en la
dirección W-E, con lo que se ajustará la ondulación del modelo a la observada.
75

Figura 3.5. Calibración local vertical TGO


Fuente: Elaboración Propia

Luego de realizado el ajuste se lee el informe de calculo para así percatar


cualquier anomalía.

Tabla 3.8. Parámetros de Ajuste Vertical TGO (Aplicación 1).

Coordenada Norte del punto de origen 6299297.100m

Coordenada Este del punto de origen 358468.010m

Separación vertical en el origen -27.772m

Pendiente Norte -8.682ppm

Pendiente Este -80.993ppm

Tabla 3.9. Resumen errores TGO (Aplicación 1)

Resumen

Error máximo Error medio cuadrático Punto

Vertical 0.018m 0.011 A

En la siguiente tabla se entregan los valores obtenidos de altura ortométrica con


la calibración vertical GPS hecha en el software TGO:
76

Tabla 3.10. Alturas Ortométricas entregadas por TGO (Aplicación 1)

Punto Htgo
A 595.018
B 799.002
C 950.017
D 589.001
1 600.986
6 579.997
7 659.991
8 732.997
9 581.991

3.3 APLICACIÓN 2: LÍNEA DE NIVELACIÓN CUESTA LO PRADO

3.3.1 Introducción.

Para realizar un análisis del comportamiento de la regresión múltiple en una


línea de nivelación en la que se requiera interpolar alturas ortométricas, se
utilizaron datos de la memoria realizada por María José Herrera Gatica y José
Salas Silva en el año 2007. El título de la memoria es “Metodología y desarrollo
para la georreferenciación de un proyecto vial cuesta Lo Prado”. En está
memoria se realizaron poligonales electrónicas y mediciones GPS, siguiendo
las siguientes normativas del Manual de carreteras Volumen II:

• El orden de control del trabajo y la planificación de los procedimientos


GPS de la cantidad de líneas establecidas, serán según el capítulo 2.300
Ingeniería básica – Aspectos Geodésicos y topográficos, sección 2.301
Aspectos generales y referenciación de los estudios, capítulo 2.301.403
Referenciación de un Sistema de transporte de coordenadas secundario.
77

• La medición de las líneas bases tomadas con GPS, se realizaron con el


método estático rápido, tomando en consideración los tiempos
establecidos en el capítulo 2.300 Ingeniería básica – Aspectos
Geodésicos y topográficos, sección 2.312 Transporte de coordenadas
mediante GPS, capítulo 2.312.5 Métodos estáticos.

• Las Poligonales desarrolladas se hicieron de acuerdo al capítulo 2.300


Ingeniería básica – Aspectos Geodésicos y topográficos, sección 2.310
Poligonales, capítulo 2.310.4 Poligonales Secundarias.

• Las mediciones de las poligonales serán de acuerdo al capítulo 2.300


Ingeniería básica – Aspectos Geodésicos y topográficos, sección 2.310
Poligonales, capítulo 2.310.404 Tolerancias Admisibles, específicamente
Método de medida de ángulos horizontales y Método de medida de
distancias (2.310.404(4) y 2.310.104(5) respectivamente).

• Respecto a las precisiones (de un sistema de referenciación de segundo


orden y coordenadas líneas base) y tolerancias (ángulos horizontales,
medida de distancias y en la determinación de desniveles entre vértices)
obtenidas en está memoria, todas se ajustan a lo estipulado en los
capítulos 2.301.403 y 2.310.404 respectivamente.

Las mediciones GPS fueron realizadas con 3 receptores proporcionados por la


División de Ingeniería de Vialidad del Ministerio de Obras Publicas. La marca
del receptor geodésico utilizado es Trimble Modelo R8, cuyas precisiones en
Horizontal son de ± 0.005 m + 0.5 PPM y en vertical es de ±0.005 m + 1 PPM.

Estas mediciones GPS tienen la finalidad de ligar coordenadas obtenidas en


terreno a un sistema de referencia conocido. Las coordenadas de terreno
78

obtenidas para esta referenciación, son obtenidas mediante las poligonales


medidas a lo largo del camino emplazado en la cuesta Lo Prado, que consta de
26 estaciones. Para la medición de estas poligonales se utilizo la estación total
Leica serie TPS400, con precisión en distancias de ±5 mm + 2 ppm, y lectura
angular de 5 CC .

Figura 3.6. Trimble R8 y Leica serie TPS400.


Fuente: Elaboración propia.

3.3.2 Calculo y ajuste de Alturas ortométricas cuesta Lo Prado.

Con los registros de terreno de las mediciones de poligonales electrónicas


realizados en la memoria “metodología y desarrollo de un proyecto vial cuesta
Lo Prado” se procede al calculo y ajuste de Altura ortométrica para los puntos a
utilizar en el modelo de regresión múltiple.

Lo primero es corregir a la línea los cenitales medidos en terreno


(pertenecientes a las poligonales)
79

Figura 3.7. Corrección a la línea.


Fuente: “Geodesia Geométrica” René Zepeda.

Deduciendo de la figura se puede establecer una relación para la corrección de


los cenitales a través del teorema del seno, con lo que se tiene.

m−i s ⎛ (m − i ) ⋅ Sen( Z ' ) ⎞


= Æ Como c es pequeño Z ≈ Z’ Æ c = Asen⎜ ⎟
Sen(c) Sen( Z ) ⎝ Di ⎠
Z = Z '+c
Luego se procede a calcular las distancias horizontales de cada tramo de las
dos poligonales, para esto se hace uso de los cenitales ya corregidos a la línea
y la expresión que se deduce de la siguiente figura.

Figura 3.8. Calculo de distancias horizontales. Fuente: “Geodesia Geométrica” René Zepeda.
80

Dh = Di ⋅ Cos(α ) ; α = 100 − Z Æ Dh = Di ⋅ Cos (100 − Z )

Donde:

α: ángulo vertical respecto al horizonte.

Z: ángulo cenital corregido a la línea.

La precisión del calculo de las distancias horizontales puede ser establecido por
propagación del error a través de.

2 2
⎛δ ⎞ ⎛δ ⎞
σ Dh = ⎜⎜ Dh ⎟⎟ ⋅ σ Di
2
+ ⎜⎜ Dh ⎟⎟ ⋅ σ Z2
⎝ δ Di ⎠ ⎝ δZ ⎠

Donde:

σ Di y σ Z Son las presiones de las mediciones de distancia y angulares,


respectivamente, entregadas por el instrumento utilizado.

Derivadas parciales.

δ Dh δ
= Cos (100 − Z ) ; Dh = Di ⋅ Sen(100 − Z )
δ Di δZ

La diferencia de nivel se calcula a través de mediciones recíprocas y


simultaneas.
81

Figura 3.9. Mediciones recíprocas y simultaneas.


Fuente: “Geodesia Geométrica” René Zepeda.

En los puntos A y B se miden los ángulos cenitales ZA y ZB; sus alturas son HA y
HB; e y r son los efectos de esfericidad y refracción.

De la figura anterior se deduce la expresión para el calculo de desniveles a


través de mediciones reciprocas y simultaneas, la obtención de esta fórmula
queda aclarada en el texto “Geodesia Geométrica” de Rene Zepeda Pág. 70.

1
∆H = Dh ⋅ Tan ( Z B − Z A ) Con Z B y ZA corregidos a la línea.
2

La precisión del calculo de desniveles puede ser establecido, por propagación


del error, a través de.

2 2 2
⎛δ ⎞ ⎛δ ⎞ ⎛δ ⎞
σ ∆H = ⎜⎜ ∆H ⎟⎟ ⋅ σ Dh
2
+ ⎜⎜ ∆H ⎟⎟ ⋅ σ ZB
2
+ ⎜⎜ ∆H ⎟⎟ ⋅ σ ZA
2

⎝ δ Dh ⎠ ⎝ δ ZB ⎠ ⎝ δ ZA ⎠
82

Donde:

σ Dh Es la precisión de la distancia horizontal.

σ ZA y σ ZB Son las presiones de los cenitales corregidos a la línea.

Derivadas parciales.

δ ∆H 1 δ ∆H ⎛ 1 ⎞ 2
= Tan ( Z B − Z A ) ; = Dh ⋅ ⎜⎜ Tan ( Z B − Z A ) + 1⎟⎟ ⋅ ;
δ Dh 2 δ ZB ⎝ 2 ⎠ 2

δ ∆H ⎛ 1 ⎞ 2
= − Dh ⋅ ⎜⎜ Tan ( Z B − Z A ) + 1⎟⎟ ⋅
δ ZA ⎝ 2 ⎠ 2

Para la Poligonal 1 los resultados son:

Tabla 3.11. Resultados poligonal 1.

Tramo Dhz (m) σDh (m) ∆H (m) H (m) σ∆H (m)


GPS2 551.315
GPS2 - E3 203.880 0.005 14.167 565.482 0.004
E3 - E4 587.297 0.006 74.459 639.940 0.013
E4 - E5 460.550 0.006 67.537 707.478 0.010
E5 - E6 299.079 0.006 30.296 737.774 0.006
E6 - E7 65.258 0.005 4.334 742.107 0.001
E7 - E8 28.508 0.005 1.474 743.581 0.001
E8 - GPS4 731.758 0.006 83.512 827.094 0.015
GPS4 827.358
83

Para la poligonal 2 los resultados obtenidos son:

Tabla 3.12. Resultados poligonal 2.

Tramo Dhz (m) σDh (m) ∆H (m) H (m) σ∆H (m)


GPS4 827.358
GPS4 - E11 681.807 0.006 -172.367 654.991 0.016
E11 - E12 1052.614 0.007 -295.367 359.624 0.025
E12 - E13 142.924 0.005 -10.584 349.040 0.003
E13 - E14 229.925 0.005 -20.165 328.875 0.005
E14 - E15 525.805 0.006 -33.984 294.891 0.010
E15 - E16 1083.594 0.007 -44.106 250.785 0.020
E16 - E17 474.590 0.006 -14.355 236.430 0.009
E17 - E18 561.269 0.006 -14.397 222.032 0.010
E18 - E19 754.267 0.007 -14.647 207.386 0.013
E19 - E20 470.892 0.006 -6.699 200.687 0.008
E20 - E21 348.370 0.006 -2.701 197.985 0.006
E21 - E22 303.925 0.006 -4.253 193.733 0.005
E22 - E23 984.254 0.007 -6.801 186.931 0.017
E23 - E24 292.568 0.006 -0.598 186.334 0.005
E24 - GPS5 433.388 0.006 -2.982 183.352 0.007
GPS5 182.503

Una vez obtenidos los desniveles se procede a obtener un error de cierre, para
luego ajustar dichos desniveles a través de un modelo de condición.

3.3.3 Ajuste de los desniveles a través de modelo de ecuaciones de


condición.

El ajuste por mínimos cuadrados, mediante el modelo de ecuación de condición


en forma matricial, se calcula por los siguientes pasos.
84

Figura 3.10. Pasos ajuste por mínimos cuadrados.


Fuente: Memoria “Estudio y aplicación de Modelos Geoidales como marco de referencia vertical para Chile”.

Solución:
Modelo: F (La) = 0

Las ecuaciones de condición que se forman son. Para la poligonal 1.

LGPS2-E3b + VGPS2-E3 + LE3-E4b + VE3-E4 + LE4-E5b + VE4-E5 + LE5-E6b + VE5-E6 + LE6-E7b


+ VE6-E7+ LE7-E8b + VE7-E8+ LE8-GPS4b + VE8-GPS4 – (HGPS4 – HGPS2) = 0

Para la poligonal 2:

LGPS4-E11b + VGPS4-E11 + LE11-E12b + VE11-E12 + LE12-E13b + VE12-E13 + LE13-E14b + VE13-


E14 + LE14-E15b + VE14-E15+ LE15-E16b + VE15-E16 + LE16-E17b + VE16-E17 + LE17-E18b +
VE17-E18 + LE17-E18b + VE18-E19+ LE19-E20b + VE19-E20+ LE20-E21b + VE20-E21+ LE21-E22b
85

+ VE21-E22+ LE22-E23b + VE22-E23+ LE23-E24b + VE23-E24 + LE24-GPS5b + VE24-GPS5 –


(HGPS5 – HGPS4) = 0

La matriz B, corresponde a la matriz de funciones que liga los valores


observados a la función de ajuste, es decir, a la derivada para cada valor con
respecto a su recorrido. La matriz de los coeficientes B, para la poligonal 1,
queda de la siguiente forma:

B = [1 1 1 1 1 1 1 1 1]

Mientras que para la poligonal 2:

B = [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]

La matriz de error de cierre “W” para la poligonal 1 viene dada por.

W = [0.264]

Mientras que para la poligonal 2.

W = [− 0.849]

La matriz Lb corresponde a las observaciones, en este caso desniveles.


86

⎡14.167 ⎤ ⎡ − 172.367 ⎤
⎢74.459 ⎥ ⎢− 295.367 ⎥
⎢ ⎥ ⎢ ⎥
⎢67.537 ⎥ ⎢ − 10.584 ⎥
⎢ ⎥ ⎢ ⎥
Lb poli.1 = ⎢30.296 ⎥ ⎢ − 20.165 ⎥
⎢ 4.334 ⎥ ⎢ − 33.984 ⎥
⎢ ⎥ ⎢ ⎥
⎢ 1.474 ⎥ ⎢ − 44.106 ⎥
⎢83.512 ⎥ ⎢ − 14.355 ⎥
⎣ ⎦ ⎢ ⎥
Lb poli.2 = ⎢ − 14.397 ⎥
⎢ − 14.647 ⎥
⎢ ⎥
⎢ − 6.699 ⎥
⎢ ⎥
⎢ − 2.701 ⎥
⎢ − 4.253 ⎥
⎢ ⎥
⎢ − 6.801 ⎥
⎢ − 0.598 ⎥
⎢ ⎥
⎣⎢ − 2.982 ⎦⎥

La matriz P corresponde al inverso de las precisiones al cuadrado de cada


medición. Para este caso dicha precisión viene dada por las distancias
horizontales de cada tramo. La varianza a priori σ 02 utilizada es 1.

⎡ 1 ⎤ ⎡ 1 ⎤
⎢σ 2 ⎥ ⎢ Dh 2 ⎥
⎢ 1 ⎥ ⎢ 1 ⎥
⎢ 1 ⎥ ⎢ 1 ⎥
P = σ 02 ⋅ ⎢ σ 2
⎥ Æ P = 1⋅ ⎢ Dh22 ⎥
⎢ ⎥ ⎢ ⎥
2
O O
⎢ ⎥ ⎢ ⎥
⎢ 1 ⎥ ⎢ 1 ⎥
⎢⎣ σ n2 ⎥⎦ ⎢⎣ Dhn2 ⎥⎦

Obtenidas estas matrices sólo basta aplicar el método de ecuación de condición


para así obtener los desniveles ajustados por mínimos cuadrados, de cada una
de las observaciones.
87

Cabe destacar que este método de ajuste, utilizado en un conjunto de


observaciones que presenten tan sólo una ecuación de condición, y, en la que
los pesos son establecidos en relación a la distancia (tal como el ejemplo
anterior) la solución de este modelo viene definida por:

errorcierre
comp∆H = ⋅ dist. parcial
dist.acumulada

La fórmula anterior es conocida en topografía como “compensación


proporcional a la distancia”.

Además si se da el caso en que sólo existe una ecuación de condición y la


matriz de peso es considerada igual a 1 la solución de este modelo es:

errorcierre
comp∆H =
nº tramos

La fórmula anterior es conocida en topografía como “compensación en partes


iguales”.

Tabla 3.13. Resultados alturas ortométricas ajustadas, poligonal 1.

Tramo ∆H ajustado (m) H ajustado (m)


GPS2 551.315
GPS2 - E3 14.189 565.504
E3 - E4 74.524 640.028
E4 - E5 67.588 707.617
E5 - E6 30.330 737.946
E6 - E7 4.341 742.287
E7 - E8 1.477 743.764
E8 - GPS4 83.594 827.358
GPS4 827.358
88

Tabla 3.14. Resultados alturas ortométricas ajustadas, poligonal 2

Tramo ∆H ajustado (m) H ajustado (m)


GPS4 827.358
GPS4 - E11 -172.436 654.922
E11 - E12 -295.474 359.447
E12 - E13 -10.599 348.848
E13 - E14 -20.188 328.660
E14 - E15 -34.038 294.623
E15 - E16 -44.216 250.406
E16 - E17 -14.403 236.003
E17 - E18 -14.454 221.549
E18 - E19 -14.723 206.825
E19 - E20 -6.747 200.078
E20 - E21 -2.737 197.341
E21 - E22 -4.283 193.058
E22 - E23 -6.902 186.156
E23 - E24 -0.627 185.529
E24 - GPS5 -3.026 182.503
GPS5 182.503

Finalmente con los desniveles ajustados y las alturas ortométricas calculadas


se obtienen los datos que se utilizarán en el modelo de regresión múltiple para
la obtención de altura ortométrica en “cuesta Lo Prado”

3.3.4 Aplicación 2: Uso de regresión múltiple en la línea de nivelación


cuesta Lo Prado.

En cuesta Lo Prado se realizó un modelo para la obtención de altura


ortométrica con separación de 1km entre los puntos de control, interviniendo las
siguientes estaciones:
89

Tabla 3.15. Puntos para confección modelo regresión múltiple cuesta Lo Prado.

Punto Este (m) Norte (m) h (m) H (m)


GPS1 321785.062 6295856.052 535.403 510.292
GPS2 320853.898 6295814.300 576.334 551.315
GPS3 320088.809 6294297.629 822.237 797.330
E4 320383.506 6295217.800 664.971 640.028
E8 320381.777 6294719.835 768.699 743.764
E 11 319811.766 6293979.630 679.807 654.922
E 12 319077.853 6293225.225 384.269 359.447
E 15 318216.841 6292970.246 319.371 294.623
E 16 317133.541 6292948.752 275.047 250.406
E 18 316098.133 6292976.667 246.087 221.549
E 20 314880.064 6293107.545 224.527 200.078
E 22 314403.491 6292700.978 217.483 193.058
E 24 313172.949 6292360.944 209.932 185.529

Figura 3.11. Disposición geográfica de puntos cuesta Lo Prado.


Fuente: Google Earth.
90

Se realizó un modelo de 4 parámetros tal como se dedujo en la zona de estudio


Región metropolitana (aplicación 1)

Al igual que en la aplicación 1 se impuso el valor de la unidad para la matriz


Peso, si bien, se podrían haber establecido los pesos de las mediciones, en
relación, a la precisión con que fue observada o calculada las altura ortométrica
de cada punto. Se decidió desechar esto, debido a que no se disponía de las
presiones de medición de las estaciones GPS1, GPS2 Y GPS3. Además las
mediciones de los puntos anteriormente nombrados y los de las poligonales
antes expuestas fueron realizadas en épocas y condiciones; y con técnicas e
instrumental totalmente diferente una de la otra con lo que dotar de pesos
individualizados a cada punto sería algo irresponsable.

Del capítulo 2.9.3 se tiene que la ecuación general está dada por:

H = α 0 + α 1 (E − E ) + α 2 (N − N ) + α 3 (h − h )
m m m

Aplicando el cálculo matricial, explicado en el capítulo 3.1.1, se obtienen los


siguientes resultados:

Tabla 3.16. Parámetros modelo regresión múltiple cuesta Lo Prado.

Parámetros Valor Desv. Est. t p-valor


α0 430.949 8.869E-03 39672.31536 0.000
α1 -7.619E-05 7.904E-06 -7.870594355 0.000
α2 -2.801E-05 1.533E-05 -1.491749255 0.213
α3 1.000 7.329E-05 11141.13203 0.000
Centroide
Este (m) 318175.976
Norte (m) 6293859.662
h (m) 455.705
91

Donde el contraste conjunto viene dado por la tabla 3.17 y el resumen de los
resultados obtenidos, aplicando el modelo a los mismos puntos que se utilizaron
para realizar la regresión múltiple, se encuentra en la tabla 3.18:

Tabla 3.17. Contraste conjunto de la F cuesta Lo Prado.

Tabla Suma de
ANOVA cuadrados g.l. varianza F p-valor
Modelo 617015.942 3 205671.981 2.011E+08 0.000
Residual 0.0092 9 1.023E-03
Global 617015.952 12 51417.996

R2 = 1 Rˆ 2 = 1 Sˆ R = 0.0321

Tabla 3.18. Residuos simples, estandarizados y estudentizados, cuesta Lo Prado.

Hregre. Residuos Residuos Residuos


Punto (m) simples estandarizados estudentizados
GPS1 510.317 -0.025 -1.089 -1.128
GPS2 551.321 -0.006 -0.240 -0.240
GPS3 797.329 0.001 0.056 0.056
E4 640.012 0.017 0.586 0.595
E8 743.755 0.009 0.322 0.324
E 11 654.926 -0.004 -0.156 -0.157
E 12 359.461 -0.014 -0.542 -0.547
E 15 294.635 -0.013 -0.490 -0.494
E 16 250.393 0.013 0.456 .460
E 18 221.511 0.037 1.269 1.378
E 20 200.040 0.038 1.377 1.501
E 22 193.044 0.014 0.512 0.518
E 24 185.596 -0.068 -2.773 -3.912
Prom. = -0.055
Var. = 1.071
92

900

800

700
Predicciones

600

500

400

300

200

100
100 200 300 400 500 600 700 800 900

Variables respuesta

Grafico 3.5. Predicciones v/s Variable respuesta cuesta Lo Prado.


Fuente: Elaboración propia

1.5
Residuos estandarizados

0.5

-0.5

-1

-1.5

-2

-2.5

-3
100 200 300 400 500 600 700 800 900

Predicciones
Polinómica

Grafico 3.6. Residuos estandarizados v/s Predicciones cuesta Lo Prado.


Fuente: Elaboración propia

Del grafico 3.6 se desprende que es necesario introducir un término cuadrático


debido a que el comportamiento de los residuos no es adecuado. Esto, ya que
los puntos parecen seguir una parábola, es así como basándose en la figura 3.1
93

se decide introducir el termino dist3d y dist3d al cuadrado. Además debido al


resultado del contraste de la t se concluye la no influencia de la variable Norte
en la variable respuesta altura ortométrica, por lo que se decide descartarla del
modelo.

Con todo lo anterior se construye un nuevo modelo que sigue la siguiente


expresión:

H = a 0 + a1 ( E − E m ) + a 2 ⋅ (h − hm ) + a 3 (dist 3d − dist 3d m ) + a 4 (dist 3d 2 − dist 3d 2 m )

Los resultados que entrega el nuevo modelo son:

Tabla 3.19. Parámetros y centroide modelo, nueva regresión múltiple 5 parámetros

Parámetros Valor Desv. Est. (m) t p-valor


α0 430.949 2.229E-03 193320.052 0.000
α1 -9.224E-05 1.587E-06 -58.127 0.000
α2 4.959E-05 9.051E-06 5.479 0.000
α3 1.000 1.902E-05 52571.957 0.000
α4 -1.251E-08 1.553E-09 -8.051 0.000
Centroide
Este (m) 318175.976
Norte (m) 6293859.662
h (m) 455.705
Dist3d media (m) 2640.213
Dist3d media cuadrada 8522052.103
94

Tabla 3.20. Tabla ANOVA nueva regresión múltiple 5 parámetros.

Tabla Suma de
ANOVA cuadrados g.l. Varianza F p-valor
Modelo 617015.951 4 154253.988 2.388E+09 0.000
Residual 0.0005 8 6.460E-05
Global 617015.952 12 51417.996

R2 = 1 Rˆ 2 = 1 Sˆ R = 0.008

Tabla 3.21. Residuos simples, estandarizados y estudentizados, modificación modelo cuesta Lo Prado.

Hregre. Residuos Residuos Residuos


Punto (m) Simples Estandarizados Estudentizados
GPS1 510.281 0.011 2.4906548 3.03047239
GPS2 551.333 -0.018 -2.6282145 -4.47866819
GPS3 797.328 0.002 0.4024259 0.35585305
E4 640.030 -0.002 -0.2261110 -0.24241319
E8 743.760 0.004 0.5487285 0.56562111
E 11 654.922 0.000 -0.0502900 -0.04948223
E 12 359.446 0.002 0.2691117 0.29634225
E 15 294.623 0.000 -0.0294420 -0.02734138
E 16 250.409 -0.002 -0.3408733 -0.35111426
E 18 221.548 0.001 0.1088128 0.11441399
E 20 200.077 0.001 0.2334229 0.23880563
E 22 193.053 0.005 0.7591222 0.76519272
E 24 185.533 -0.004 -1.5749783 -0.53887304
Prom. = -0,003
Var. = 1,303
95

900

800

700
Predicciones

600

500

400

300

200

100
100 200 300 400 500 600 700 800 900

Variable respuesta

Grafico 3.7. Predicciones v/s Variable respuesta, modificación modelo cuesta Lo Prado.
Fuente: Elaboración propia

2
Residuos estandarizados

-1

-2

-3
0 100 200 300 400 500 600 700 800 900

Predicciones

Grafico 3.8. Residuos estandarizados v/s Predicciones, modificación modelo cuesta Lo Prado.
Fuente: Elaboración propia
96

3.3.5 Aplicación de ajuste TGO a la línea de nivelación cuesta Lo Prado.

Los resultados obtenidos en la calibración GPS altimétrica en el TGO son:

Tabla 3.22. Parámetros ajuste vertical TGO cuesta Lo Prado

Coordenada Norte del punto de origen 6295856.052m

Coordenada Este del punto de origen 321785.063m

Separación vertical en el origen -25.083m

Pendiente Norte -27.742ppm

Pendiente Este -75.393ppm

Y los resultados para cada punto son:

Tabla 3.23. Alturas Ortométricas entregadas por TGO, cuesta Lo Prado.

Punto H TGO (m)


GPS1 510.320
GPS2 551.322
GPS3 797.325
E4 640.011
E8 743.753
E11 654.925
E12 359.463
E15 294.637
E16 250.395
E18 221.512
E20 200.041
E22 193.044
E24 185.595
97

3.4 AUTOMATIZACIÓN EN SOFTWARE ARCVIEW 3.3.

Se procede a automatizar los procedimientos expuestos en esta memoria


mediante lenguaje Avenue. Se consideró la explicación detallada sólo de la
estimación y transformación de parámetros, tanto en horizontal y vertical.

3.4.1 Automatización coordenadas planimétricas.

a- Estimación de parámetros para transformación bidimensional de


coordenadas.

Una ves en el software Arcview se debe seleccionar el ítem “Estimación


parámetros” Æ “Parámetros Horizontales”.

A través del paso anterior se ingresa en la rutina para el cálculo de parámetros


de una transformación bidimensional de Helmert.

Se debe seleccionar una tabla en formato .dbf con los campos Punto, E1, N1,
E2, N2. Luego de esto la rutina calculará los parámetros Tx, Ty, ángulo de
rotación y factor de escala, además del punto de origen (X0, Y0) residuo mayor
en X e Y (indicando el nombre de los puntos en los que estos residuos
máximos están ocurriendo) y el error medio cuadrático de la transformación.
Estos resultados se desplegarán en pantalla (figura 3.12) para poder ser
copiados por el usuario, así como también se dará la posibilidad de ser
guardados automáticamente a un archivo de extensión escogida por el mismo.
98

Figura 3.12. Parámetros de transformación bidimensional.


Fuente: Arcview Gis 3.3

b- Aplicación de parámetros para transformación bidimensional de


coordenadas.

Para la aplicación de parámetros de transformación se debe seleccionar


“Transformación” Æ “E1, N1 ---> E2, N2”

Si se acaba de realizar una estimación de parámetros horizontales, entonces


los parámetros de dicha estimación estarán ya ingresados en la pantalla
“Parámetros horizontales” (figura 3.13). Si se desea realizar una aplicación de
parámetros distinta sólo se deben sobrescribir dichos parámetros y punto de
origen. Hecho esto sólo basta con pulsar siguiente y elegir una tabla de datos
en formato .dbf que contenga los campos Punto, E1, N1. Luego de esto se
podrán exportar los resultados a un archivo de extensión escogida por el
usuario tal como se muestra en la figura 3.14 en donde E2CALCULAD y
N2CALCULAD representan las coordenadas calculadas, en base a los
parámetros antes estimados, para dos puntos de control dados.
99

Figura 3.13. Transformación bidimensional de coordenadas.


Fuente: Arcview Gis 3.3

Figura 3.14.Tabla de datos exportados.


Fuente: Microsoft Excel.
100

3.4.2 Automatización de parámetros verticales.

a- Estimación de parámetros verticales

La estimación de parámetros verticales se encuentra en el ítem “estimación de


parámetros”Æ”parámetros verticales”, abriendo la ventana mostrada en la figura
3.15.

Figura 3.15. Estimación parámetros verticales Arcview.


Fuente: Arcview Gis 3.3.

Se encuentran programadas 4 tipos de regresiones aptas para:

• Zonas en general: Cualquier extensión de terreno que se requiera


estimar parámetros verticales.

• Línea de nivelación E-O: en el caso que se requiera estimar


parámetros verticales de líneas de nivelación orientadas Este- Oeste.

• Línea de nivelación N-S : en el caso que se requiera estimar


parámetros verticales de líneas de nivelación orientadas Norte- Sur

• Línea nivelación general: en el caso que se requiera estimar


parámetros verticales de líneas de nivelación sin orientación definida.
101

Luego de seleccionar cualquiera de las opciones y hacer clic en “siguiente”, se


muestra una caja de diálogo en donde, indistintamente del tipo de regresión
seleccionado, se requerirá el archivo en el que se encuentran los datos con los
cuales se quiera hacer la regresión. Estos datos deben estar formato .dbf y
tener datos como Punto, Este, Norte, altura elipsoidal y altura ortométrica
(Figura 3.16).

Figura 3.16. Caja de diálogo Estimación vertical.


Fuente: Arcview Gis 3.3.

Luego de dar “OK”, se busca y agrega el archivo con los datos requeridos. Al
realizar esta acción se despliega de inmediato, la siguiente ventana informativa:

Figura 3.17. Centroide automatizado, obtenido de datos insertados para realizar regresión.
Fuente: Arcview Gis 3.3.
102

En la figura 3.17, se tiene el centroide calculado automáticamente del archivo


de puntos que se acaba de insertar y que obedece a la explicación teórica y de
desarrollo, expuesta en secciones anteriores de esta memoria. Al hacer clic en
“OK” en el cuadro de diálogo del centroide calculado, Arcview preguntará si se
desea guardar la tabla creada con la transformación realizada, la que se debe
guardar con la misma extensión .dbf. Ésta luego de ser guardada, se abrirá
automáticamente junto con la página.
“http://www.wessa.net/rwasp_multipleregression.wasp”

Donde se encuentra Múltiple Regression - Free Statistics Software (Calculator).

b- Utilización de Multiple Regression - Free Statistics Software


(Calculator).

Antes de explicar la utilización de este software libre, se debe entender que está
calculadora de regresión múltiple, entrega valores muy similares a los
realizados manualmente y expuestos en esta memoria.

A continuación se describirán los módulos de utilización de Multiple Regression


- Free Statistics Software (Calculator), combinado con la programación hecha
en Arcview GIS 3.3, para la estimación de parámetros verticales.
103

Figura 3.18. Módulos de utilización de Multiple Regression - Free Statistics Software (Calculator).
Fuente: Elaboración Propia

1- Send output to: se selecciona el formato de salida de los resultados de


la regresión.

2- Data X: se insertan los valores de los “deltas” que entrega la tabla que se
abre junto con la calculadora. Estos se encuentran separados por
104

columnas, incluyendo la variable a la que se le desea aplicar la regresión


(altura ortométrica), como muestra la siguiente figura:

Figura 3.19.Valores a insertar en calculadora.


Fuente: Elaboración Propia

En donde los parámetros encerrados, son los que se copian y pegan en el


módulo 2 de Multiple Regression - Free Statistics Software (Calculator).

3- Names of X columns: Se introduce el nombre de cada variable.

4- Sample Range: Rango de las observaciones.

5- Column Number of Endogenous: Número de la columna donde se


encuentra la variable que se le desea aplicar la regresión

6- Fixed Seasonal Effects: Efectos predeterminados en página.

7- Type of equation: Se selecciona el tipo de ecuación que desea aplicar.


105

8- Chart option: Resolución de gráficos.

Luego de verificar los 8 módulos, se procede a hacer clic en “Compute”, para la


obtención de los parámetros. La calculadora entrega las siguientes tablas de
resultados, resumidos en la figura 3.20:

Figura 3.20. Resultados entregados por Multiple Regression - Free Statistics Software (Calculator).
Fuente: Elaboración Propia

En donde:

1. Entrega la función de regresión múltiple general con los correspondientes


parámetros estimadores de cada variable.
106

2. Entrega los parámetros para cada variable, varianza residual para cada
parámetro y contraste de la t.

3. Coeficientes de determinación y correlación corregida, contraste de la F y


varianza residual del modelo.

Además de lo anterior, Multiple Regression - Free Statistics Software


(Calculator), entrega la validación de los mismos puntos que se utilizaron en el
modelo, mediante la siguiente tabla que se muestra en la figura 3.21:

Figura 3.21. Tabla de validación.


Fuente: Elaboración Propia

Como se menciono en el punto 1 de la figura 3.21, se pueden exportar los


resultados entregados por la página, a diferentes formatos, como planillas
Excel, en formato de textos, etc.
107

c- Aplicación de parámetros para transformación vertical.

Con los parámetros obtenidos de la página, se procede a la transformación


vertical. Ésta transformación es básicamente el traspaso de altura elipsoidal a
altura ortométrica, para esto, el único requerimiento es tener un archivo .dbf que
contenga datos como nombre del Punto, Este, Norte y altura elipsoidal.

Al igual que la transformación planimétrica, al acceder a la transformación


vertical (“Transformación”Æ “E,N,helipÆE,N,Hortometrica”) se abre un cuadro
en donde se encuentran los parámetros de la última estimación vertical
realizada. En el caso que se haya realizado cualquier otra operación, se deberá
ingresar los datos del centroide de forma manual como se muestra en la figura
3.22 (primer recuadro segmentado)

Figura 3.22. Caja transformación vertical.


Fuente: Arcview Gis 3.3.
108

También en la figura 3.22, el segundo recuadro segmentado es donde se deben


copiar los parámetros entregados por Multiple Regression - Free Statistics
Software (Calculator), los que fueron mostrados en el punto 2 de la Figura 3.18.

Luego de aplicada la transformación, se procede a guardar la nueva tabla


creada, en donde básicamente es la misma que se inserto, pero ahora con una
nueva columna llamada Hort, que contiene el valor de la altura ortométrica a
través de parámetros estimados localmente (Figura 3.23)

Figura 3.23. Resultado transformación vertical en Arcview.


Fuente: Elaboración Propia

3.4.3 Datos desplegables a la vista.

Todas las aplicaciones antes mencionadas presentan la posibilidad de traer a la


vista los datos, utilizados para estimar parámetros, o calculados a través de
parámetros antes establecidos, siempre y cuando se encuentren bajo el
109

elipsoide de referencia WGS84 (o similar Ej. GRS80) y estén proyectados en


UTM Zona 19 sur. Las capas geográficas de Chile utilizadas fueron obtenidas
de la página Web.
“http://berlin.dis.ufro.cl/catalogo/c01fichas/c01av_utm.html”

Todas las coberturas fueron elaboradas sobre la base del Mapa digital del
Mundo (DCW, Digital Chart of the World), un proyecto realizado por la Empresa
ESRI (Environmental Systems Research Institute, Inc.) para la Agencia de
Cartografía de Defensa de los Estados Unidos (DMA, US Defence Mapping
Agency)

La cartografía del Mapa Digital del Mundo fue elaborada en el año 1993 a la
escala 1:1.000.000. Las coberturas de los límites exteriores y de las costas
continentales tienen su origen en el Mapa Digital del Mundo, tanto como las de
los Ríos, Esteros, Lagos, Salares y Quebradas. Todas las demás coberturas
fueron digitalizadas en el Laboratorio SIG de La Facultad de Ingeniería,
Ciencias y Administración de La Universidad de la Frontera (Temuco – Chile)

Si se ha aceptado la importación de archivos a la vista entonces se le


consultará donde se encuentra el archivo que contiene las coordenadas para
ser graficadas. Luego de elegir el archivo se desplegará en pantalla la ventana
“Add Event Theme” en donde se debe seleccionar la tabla antes importada y los
campos X e Y
110

Figura 3.23. Add Event Theme.


Fuente: Arcview Gis 3.3

Hechos los arreglos anteriores se desplegarán en la vista los puntos importados


y tabla de datos de estos.

Figura 3.23. Vista de puntos importados a las capas. Fuente: Arcview Gis 3.3.
111

CAPITULO IV – ANALISIS DE RESULTADOS.

4.1 ANTECEDENTES

En el desarrollo del modelo de regresión múltiple, visto en el capítulo 3, se


analizó la bondad de los modelos para la aplicación 1 y aplicación 2. Esto a
través de fundamentos estadísticos tales como: varianza residual, contrastes
individuales de la t, contraste conjunto de la F y coeficientes de determinación y
de correlación. En donde los resultados obtenidos se consideraron favorables.
Por lo que en este capítulo se contrastarán los resultados de los modelos de
regresión múltiple con los resultados obtenidos a través del software TGO.
Además se validarán los parámetros de los modelos con puntos de control
establecidos en la misma zona.

Debido a que la aplicación 1 es un área de estudio, mientras la aplicación 2 es


una línea de nivelación, se podrá realizar en la primera, un análisis nemotécnico
(o de más fácil apreciación por parte del lector) de la distribución espacial de los
residuos obtenidos por el ajuste local GPS TGO y del modelo de regresión
múltiple realizado.

4.2 ANÁLISIS APLICACIÓN 1: ZONA ESTUDIO REGIÓN METROPOLITANA.

4.2.1 Contraste residuos TGO y Modelo de regresión múltiple.

Luego de haber desarrollado el modelo de regresión múltiple para la aplicación


1 y después de ajustar verticalmente los puntos con el software TGO, se obtuvo
el siguiente grafico de comparación de residuos:
112

0.02

0.015

0.01

0.005

-0.005

-0.01

-0.015

-0.02
A B C D 1 6 7 8 9

Residuos modelo Residuos TGO

Gráfico 4.1. Comparación Residuos Modelo de regresión v/s Residuos TGO.


Fuente: Elaboración Propia

Del grafico 4.1 se concluye que en todos los puntos que se utilizaron para la
construcción, tanto del modelo aplicación 1 como para el plano TGO, los
residuos de aplicación 1 son mucho menores y tienden a 0. Además es
imprescindible analizar la magnitud de estos residuos (o discrepancias) y
compararlos con valores de tolerancia propuestos para un determinado
proyecto de ingeniería. Un buen estimador para esto es el que considera que la
tolerancia en la obtención de alturas a diferentes escalas es 1/8 de la
equidistancia entre curvas de nivel. Como muestra la siguiente tabla:

Tabla 4.1. Tolerancias altimétricas dependiendo de la escala.

Escala Plano Equidistancia(m) Tolerancia(m)


1:10000 10 1.250
1:5000 5 0.625
1:2000 2 0.250
1:1000 1 0.125
1:500 0.5 0.063
113

En base a las discrepancias obtenidas, tanto en el modelo de la aplicación 1


como el modelo TGO, y las tolerancias expuestas en la tabla 4.1 se concluye
que los dos ajustes son validos de ser utilizados en proyectos de ingeniería de
escalas menores a 1:500.

4.2.2 Validación parámetros de estimación Altura ortométrica aplicación 1.

Los parámetros de estimación de altura ortométrica obtenidos en el modelo


aplicación 1 tienen validez dentro de la zona de estudio y se espera que los
valores que se extrapolen fuera de la zona no sean, en magnitud, tan
favorables.

Para comprobar lo anterior se establecieron 56 puntos de control, de estos 26


están ubicados fuera de la zona de estudio. Estos 56 puntos están distanciados
desde 1.2km hasta 11.5km desde el centro del área estudiada y se encuentran
distribuidos homogéneamente evitando así zonas sin información.

Aplicando el modelo los residuos oscilan entre 0m y 0.23m. Encontrándose los


mayores residuos en los puntos ubicados a más de 7km de la media, es decir,
los que se ubican fuera de la zona de estudio. De esta forma queda demostrado
que la aplicación de los parámetros fuera del perímetro de 7km entregará
discrepancias fuera de las tolerancias impuestas en 4.1.1

Además, con estos 56 puntos, se establecieron 8 subzonas (figura 26)


determinadas por la distancia al centro, en donde se comparó y determinó la
precisión del modelo obtenido, para la aplicación 1 versus el ajuste vertical el
software TGO.
114

Figura 4.1. Subzonas establecidas por distancia a su centro.


Fuente: Elaboración Propia

En la tabla 4.2 se muestran las precisiones y en donde se infiere que dentro de


la zona de 100 km2, el modelo de la aplicación 1 entrega mejores resultados, no
obstante en los resultados fuera de él, el software TGO se comporta de mejor
forma.
Tabla 4.2. Precisiones modelo aplicación 1 v/s TGO, por subzonas.

Intervalo (m) RMS Modelo RMS TGO


0-1500 0,002 0,013
1501-3000 0,002 0,012
3001-4500 0,004 0,008
4501-6000 0,004 0,004
6001-7500 0,008 0,010
7501-9000 0,083 0,022
9001-10500 0,065 0,034
10501-12000 0,120 0,032
115

Figura 4.2. Distribución espacial de residuos aplicación 1 aplicada a los 56 puntos.


Fuente: Elaboración Propia

Figura 4.3. Distribución espacial de residuos TGO aplicada a los 56 puntos.


Fuente: Elaboración Propia
116

A continuación se mostrará en las figuras 4.4 y 4.5 la distribución espacial de


los residuos para el modelo aplicación 1 y para el plano TGO, respectivamente.

Figura 4.4. Distribución espacial de residuos en valor absoluto


de la aplicación 1, en los 100 km2 de la zona de estudio.
Fuente: Elaboración Propia

Figura 4.5. Distribución espacial de residuos en valor absoluto


del software TGO, en los 100 km2 de la zona de estudio.
Fuente: Elaboración Propia
117

4.2.3 Intervalos de confianza y de predicción.

A la hora de interpolar un valor a través de un modelo de regresión múltiple es


necesario razonar que es lo que se busca, es así como nacen dos posibles
situaciones estimar o predecir.

r r
Estimar la media de la distribución condicionada de Y / X = xt . Esto es, se
r r r
quiere estimar el parámetro m( xt ) = E (Y / X = xt ) y poder establecer cual es la

Altura ortométrica media de un punto de coordenadas Estei, Nortei, hi. Esta


estimación es entregada a través de un intervalo de confianza a un tanto por
ciento.

Predecir el valor de la variable respuesta en un individuo del que se conoce que


r r
X = x h . Esto es, se quiere predecir un valor de la variable condicionada
r r
Y / X = x h .Con lo que se quiere establecer cual es la altura ortométrica que se

predice para un punto de coordenadas Estei, Nortei, hi. Esta predicción es


entregada a través de un intervalo de predicción a un tanto por ciento. A
continuación se sacaron muestras de cada subzona, desarrollada en 4.1.2, de
manera de ver con que intervalo de confianza y predicción se esta comportando
el modelo. Para esto se tiene los siguientes valores de altura ortométrica para
cada punto de muestra:

Tabla 4.3. Altura ortométrica de puntos muéstrales.

Punto H
1.5kmE 631
3kmE 669
8(4.5KM) 700
6kmE 775
7.5kmN 702
9kmN 632
10.5kmS 589

12kmN 1060
118

En donde la estimación de la media de la distribución condicionada y la


predicción del valor de altura ortométrica, para cada muestra, viene dada en la
tabla 4.4 con su correspondiente varianza:

Tabla 4.4. Estimación y predicción para muestras.

SR med. SR
Punto Xt = Xh yt Cond.(m) predi.(m)
1.5kmE (354980.146,6294733.2915,658.437) 631.000 0.002 0.005
3kmE (356035.1795,6294476.2539,696.522) 669.001 0.002 0.005
8(4.5KM) (356150.01,6292285.25,727.516) 700.002 0.002 0.005
6kmE (358352.4284,6297120.2144,802.74) 774.997 0.002 0.005
7.5kmN (356463.7346,6300349.7043,729.621) 702.003 0.003 0.005
9kmN (350675.1759,6302415.9201,659.195) 632.013 0.004 0.005
10.5kmS (346872.1471,6287438.4586,615.744) 589.009 0.004 0.005
12kmN (360987.9625,6302875.7012,1088.031) 1059.982 0.007 0.008

Obteniéndose así los siguientes intervalos de confianza con su correspondiente


amplitud (longitud):

Tabla 4.5.Intervalos de confianza e intervalos de predicción.

Intervalo de
Punto confianza longitud intervalo de predicción longitud
1.5kmE 630.998 631.003 0.005 630.990 631.011 0.021
3kmE 668.998 669.003 0.005 668.990 669.011 0.021
8(4.5KM) 700.000 700.005 0.005 699.992 700.013 0.021
6kmE 774.994 775.000 0.006 774.986 775.008 0.022
7.5kmN 702.000 702.007 0.007 701.992 702.015 0.023
9kmN 632.005 632.020 0.014 631.997 632.028 0.030
10.5kmS 589.002 589.015 0.013 588.994 589.023 0.029
12kmN 1059.958 1060.006 0.048 1059.950 1060.014 0.064
119

4.3 ANÁLISIS APLICACIÓN 2: LÍNEA DE NIVELACIÓN CUESTA LO PRADO.

4.3.1 Contraste residuos TGO y Modelo de regresión múltiple.

A continuación se procede a comparar los residuos entregados por el modelo


de regresión múltiple realizado para la aplicación 2 y el ajuste vertical hecho por
el software TGO (Gráfico 10).

0.04

0.02

-0.02

-0.04

-0.06

-0.08
GPS1 GPS2 GPS3 E4 E8 E 11 E 12 E 15 E 16 E 18 E 20 E 22 E 24

Residuos modelo Residuos TGO

Gráfico 4.2. Comparación Residuos Modelo de regresión aplicación 2 v/s Residuos TGO.
Fuente: Elaboración Propia

En base al gráfico 4.2 se concluye que los residuos entregados por el modelo
de regresión múltiple realizado para la aplicación 2, correspondiente a la cuesta
Lo Prado, son mucho menores que los entregados por el ajuste vertical
realizado con el software TGO. Además, la varianza residual obtenida por el
modelo de regresión es menor a la obtenida por el software TGO. Sin embargo
ambos ajustes están dentro de las tolerancias altimétricas según lo explicado en
4.1.1.
120

4.3.2 Validación parámetros de estimación Altura ortométrica.

Para realizar la validación de parámetros de alturas ortométrica obtenidas por


regresión múltiple en la línea de nivelación cuesta Lo Prado, se dispuso puntos
dentro y fuera de ella. En total son 13 puntos de control, como se aprecia en la
figura 4.6.

Figura 4.6. Puntos de control cuesta Lo Prado.


Fuente: Google Earth.

Aplicando el modelo realizado a los puntos de control, los residuos oscilan entre
0 y 0.013m. Como se muestra en la siguiente tabla:
121

Tabla 4.6. Puntos de control cuesta Lo Prado, aplicando modelo de regresión.

Hregre (m) H (m) residuos (m)


GPS5 182.514585 182.503 0.012
GPS6 190.397606 190.403 -0.005
GPS4 827.371495 827.358 0.013
E3 565.503694 565.504 -0.001
E5 707.608463 707.617 -0.008
E6 737.943189 737.946 -0.003
E7 742.284345 742.287 -0.003
E 13 348.847937 348.848 0.000
E 14 328.659257 328.660 -0.001
E 17 236.004492 236.003 0.001
E 19 206.823444 206.825 -0.002
E 21 197.335724 197.341 -0.006
E 23 186.156918 186.156 0.001

Los puntos GPS4, GPS5 Y GPS6, son los que tienen los residuos más grandes,
debido a que se encuentran fuera de de la línea de nivelación. El resto de los
puntos de control se encuentran dentro de la precisión lograda por el modelo
(0.008m).
122

CAPITULO V – CONCLUSIONES Y RECOMENDACIONES.

5.1 CONCLUSIONES.

Debido al cada vez más masivo uso del sistema de posicionamiento global y del
desarrollo de este en materia de precisión en la obtención de datos
planimétricos y altimétricos, se hace necesario y útil el aprovechamiento de esta
tecnología. En este tema y centrándonos en la obtención de altura ortométrica,
hasta que no se tenga un pleno conocimiento físico de la superficie terrestre, los
modelos matemáticos de interpolación, extrapolación y finalmente predicción
son los que posibilitan el uso de la tecnología GNNS en obras de ingeniería.

Según el principio de propagación de errores, la calidad final del proceso de


estimación y residuos resultantes estará limitado por la fuente de donde son
obtenidos los datos involucrados en el modelo. Para la aplicación 1 dependerá
directamente de la distribución uniforme, en cada punto, de la precisión del
modelo geoidal global EGM96, mientras que para la aplicación 2 depende del
método de obtención de desniveles, a través de mediciones trigonométricas,
utilizado.

Aplicados los dos modelos, Modelo de regresión múltiple y Ajuste vertical


software TGO, para la obtención de altura ortométrica, basado en los mismos
puntos, se tiene que:

• El objetivo principal de este trabajo de memoria está cumplido al ser


capaz de calcular la altura ortométrica de un punto del que se conocen
sus coordenadas planimétricas y su altura elipsoidal (posicionamiento
GPS) y que la precisión entregada es apta para aplicaciones
cartográficas a escalas menores a 1:500.
123

• Con respecto a los resultados obtenidos en “términos residuales” entre el


modelo de regresión múltiple y el software TGO, para puntos que se
encuentren dentro de la zona de estudio (o línea de nivelación) Se
verifica que serán más pequeños los que entregue el modelo de
regresión. Siendo ambos modelos factibles de ser mejorados a través de
una muestra mejor distribuida geográficamente así como también por la
incorporación de nuevos puntos.

• Fuera de la zona de estudio el modelo de regresión múltiple pierde cierto


grado de confianza (la magnitud de esta pérdida será directamente
explicada por el relieve de la zona) es por esto que se le recomienda al
lector, para datos extrapolados, la utilización de un modelo que minimice
esta pérdida en la precisión, como por ejemplo, el ajuste vertical
realizado por el software TGO.

• La precisión resultante para los parámetros son acordes con los residuos
obtenidos de las alturas ortométricas estimadas.

El modelo puede ser realizado indistintamente en cualquier proyección


cartográfica. Quedando propuesta la hipótesis de que al utilizar una proyección
con menor deformación, se obtengan mejores resultados.

Con respecto a la zona y línea de nivelación estudiada (Aplicación 1 y


Aplicación 2) cabe señalar que están situadas en zonas de alta variación de
relieve (Aplicación 1 en el piedemonte del valle de Santiago, mientras que la
aplicación 2 en una cuesta montañosa) también es necesario mencionar que en
estas dos aplicaciones se utilizaron una pequeña cantidad de datos de entrada
(en comparación con la zona o línea de nivelación a cubrir) con lo que, aunque
se distribuyó de la mejor forma los datos que se disponían, no se logró evitar
124

dejar zonas sin información. Todo lo anterior implica que los modelos
matemáticos fueron puestos a prueba bajo condiciones adversas, y explica los
resultados ya expuestos. Es así, como cabe esperar que en condiciones más
favorables, o de menor relieve, los modelos entreguen mejores resultados. Así
como también se lograría un resultado mas favorable, con la introducción de
mas datos de entrada, característica (desventaja por lo general) de los modelos
de regresión múltiple.

Con respecto al modelo matemático utilizado (regresión múltiple) cabe señalar,


o mejor dicho repetir y recalcar, que es un modelo altamente efectivo en la
mayoría de las situaciones, pero del cual se debe tener gran cuidado en sus
resultados y conclusiones. Esto se debe a que al ser un modelo que se adapta
a cada dato de entrada (no realiza un plano definido) ante la presencia de
errores presentes en los datos con que se construyó el modelo, este se
adaptará incluso a estos errores. Con lo que los resultados no serán los reales,
para evitar esto es indispensable realizar los estudios estadísticos señalados en
esta memoria. Así por ejemplo, si se realiza una revisión de los residuos
obtenidos se podrá concluir que datos pueden presentar errores y así ser
eliminados del modelo. Este tipo de modelo es susceptible de ser mejorado, al
introducir variables nuevas o de mayor orden.

Respecto a la estimación de parámetros, precisiones y resultados en general,


para los modelos de regresión múltiple (aplicación 1 y aplicación 2) Estos
fueron calculados y aplicados en hojas de cálculo de Microsoft Excel. Mientras
que para la automatización, de estos mismo cálculos, se hizo uso de la página
Web “www.wessa.net” (sección regresión múltiple) creada por el Profesor. Dr.
P. Wessa. Obteniéndose resultados semejantes. La aplicación efectiva de los
parámetros fue realizada en Arcview GIS 3.3 confirmando que las diferencias
125

en la altura ortométrica, calculada, de los puntos de control se mantienen en la


aplicación en órdenes similares.

Finalmente, dentro de este trabajo de título, el rol del Ingeniero Geomensor se


rige sobre dos grandes ítems que si bien se entrelazan son necesarios separar:
la componente práctica y la componente teórica.

• El segmento práctico es el que lleva a cabo la mayor parte del trabajo.


Este segmento toma al Ingeniero Geomensor como el experto en todo
tipo de medición, topográfica o geodésica, e interpretación de planos,
cartas y mapas. Es así como debe ir a la par con el desarrollo de las
nuevas tecnologías, conocer sus aplicaciones, y participar, directamente
o dando apoyo logístico, en todo el proceso de un proyecto de ingeniería.
Este proceso puede ser simplificado como: PlanificaciónÆ Ejecución Æ
Análisis Æ Producto final.

• La componente teórica del Ingeniero Geomensor, en especial del


perteneciente a la universidad de Santiago de Chile, le permite a este
profesional, ante un problema que exija una pronta solución, contar con
más de una técnica estándar de resolución, y en el caso que estas no
existiesen, idear técnicas alternativas, basadas en el conocimiento
científico adquirido en su etapa formativa.

De forma concreta, en este trabajo de título, el Ingeniero Geomensor debe


poseer un conocimiento, para la ejecución o interacción con otros profesionales,
en:

• Mediciones geodésicas y post-proceso de estas.


126

• Mediciones topográficas (nivelación geométrica o en su defecto


trigonométrica) y post-proceso de estas.

• Proyecciones cartográficas para la adecuada unificación de


mediciones geodésicas y topográficas.

• Ajustes, basados en la minimización de errores, para la obtención de


los datos finales provenientes de las mediciones hechas en terreno.

• Inferencia estadística, modelos alternativos, estudio probabilístico.

• Algún/os lenguaje/s de programación que sea/n capaz (capaces) de


automatizar y así abaratar los gastos en termino de cálculo
matemático que conlleven las técnicas alternativas elaboradas.

• En el caso de contar con más de una técnica de solución, el Ingeniero


Geomensor debe poder tomar una decisión, basado en, calidad,
rendimiento, tiempo y costos. En torno a lo anterior se presenta en la
sección de ANEXOS un estudio de tiempo y costos para una
campaña en cuesta Lo Prado.

5.2 RECOMENDACIONES.

Como en todo trabajo de ingeniería es preciso el reconocimiento del terreno


antes de establecer las posiciones de los puntos que entrarán en el modelo, de
modo de asegurar la distribución homogénea de datos, y en el caso de una
zona de gran relieve, evitar así zonas sin información.
127

Verificar la calidad de la muestra de datos con que se realizará el modelo ya


que la precisión esperada no será mejor que la de la muestra.

En el caso de una línea de nivelación se noto la mejoría del modelo al introducir


las variables distancia y distancia al cuadrado, ya que por fundamentos
estadísticos explicados en esta tesis, influyen en la obtención de altura
ortométrica.

En el caso de una línea de nivelación se recomienda verificar la orientación de


esta ya que dependiendo de lo anterior se tienen las siguientes situaciones:

• Si la línea presenta una dirección Norte-Sur la variable Este no será


necesario introducirla al modelo.

• Si la línea presenta una dirección Este-Oeste la variable Norte no será


necesario introducirla al modelo.

• Si no se da ninguno de los casos anteriores las dos variables son


significativas, y será necesario introducirlas al modelo.
128

ANEXOS.

Estudio de tiempo y costos para una campaña en cuesta Lo Prado.

En esta sección se ha querido otorgar al lector una guía de los procedimientos


que se llevarían a cabo en una campaña en cuesta Lo Prado. Así fijado el
procedimiento se establece un estudio de tiempo y costos. Para este estudio se
recurrió a dos fuentes, la primera un Ingeniero Geomensor titulado de la
universidad de Concepción, el que se desempeña actualmente realizando este
tipo de trabajos (levantamientos geodésicos, taquimétricos, y nivelaciones); y la
segunda una empresa de arriendo de instrumental topográfico/geodésico para
así establecer el desglose debido a este ítem.

COTIZACION 1: Línea de de nivelación con apoyo de puntos GPS.

Especificaciones de la ejecución del trabajo:

• La toma de los 13 puntos señalados en la fotografía aérea


monumentados y medidos con GPS Geodésico Topcon de doble
frecuencia, con lo cual se obtendrá coordenadas y altura elipsoidal de los
puntos.

• Se hará nivelación geométrica de los 13 puntos ocupando como


referencia algún punto de nivelación del IGM cercano al sector de
trabajo.

• La duración del trabajo en terreno será de 10 días y 2 días para la


confección de plano e informe.
129

• La presentación del trabajo se entregará en tres copias de planos a la


escala 1:2000 y con respaldo de los archivos digitales en Autocad 2004 y
2007.

• Se hará entrega de planillas en formato Excel donde estarán los


descriptores, coordenadas y alturas de los puntos tomados en la línea.

• Cada punto tendrá sus correspondientes monografías (coordenadas y


altura)

• Se dejarán a lo menos 6 PRS en terreno para efectos de inspección o


futuros Levantamientos y replanteos topográficos.

Honorarios:

Los honorarios para la línea de nivelación con apoyo de puntos GPS, tiene un
costo de $1.850.000 más el 10% de impuesto.

COTIZACION 2: Línea de nivelación geométrica.

Especificaciones de la ejecución del trabajo:

• La toma de los 13 puntos señalados en la fotografía aérea


monumentados y medidos con nivelación geométrica.

• Se hará nivelación geométrica de los 13 puntos ocupando como


referencia algún punto de nivelación del IGM cercano al sector de
trabajo.
130

• La duración del trabajo en terreno será de 7 días y 2 días para la


confección de plano e informe.

• Cada punto tendrá sus correspondientes monografías (coordenadas de


precisión de navegador GPS para su futura ubicación)

Honorarios:

Los honorarios para la línea de nivelación geométrica, tiene un costo de


$1.250.000 más el 10% de impuesto.

Presentación:

Expediente con la siguiente información:

• Informe topográfico.

• 3 copias de planos.

• CD que contiene archivos digitales de los planos, monografías e informe.

• Copia de patente municipal

Hasta el momento se dispone de dos cotizaciones, la primera indica el gasto en


el que debe incurrir el mandante, para así, establecer una pequeña cantidad de
puntos nivelados y geodésicamente ubicados. Este proceso debe ser realizado,
para que así, se disponga de datos de partida en la construcción del modelo
matemático que densificará futuros puntos. La segunda cotización indica el
coste en el que deberá incurrir el mandante en una futura densificación de
131

puntos (nivelación geométrica, replanteo trigonométrico a través de estación


total, posicionamiento GPS de baja precisión). Es preciso aclarar que se
realizará una comparación de costos y tiempo entre la densificación de futuros
puntos a través del modelo matemático versus una nivelación geométrica, esto,
debido a la información con que se dispone.

COTIZACION INSTRUMENTAL TOPOGRAFICO/GEODESICO.

Instrumental Marca / Modelo Valor Valor Valor Valor


Diario Semanal Quincenal Mensual

GPS GEODESICO SPECTRA $35.000 $180.000 $260.000 $380.000


SIMPLE FRECUENCIA PRECISIÓN
Incluye: 2 antenas colectoras, EPOCH-10
trípode, jalón o trípode, bases
nivelarte, cables de comunicación,
software post proceso. Cheque
Garantía por 2.500.000 o en blanco

GPS
DOBLE FRECUENCIA TOPCON $72.000 $390.000 $720.000 $1.400.000
Incluye: 2 antenas colectoras, CGD
trípode, jalón o trípode, base
nivelantes, cables de comunicación,
software post proceso.
Cheque Garantía por 8.000.000 o
en blanco

Estación Total Topcon GTS-212 $20.000 $125.000 $190.000 $280.000


Incluye: Cable comunicación, Topcon GTS-229 $20.000 $125.000 $190.000 $280.000
batería, cargador, trípode madera, Pentax PCS1215 $17.000 $100.000 $150.000 $250.000
jalón 4,7m, prisma, porta prisma Nikon DTM 332 $18.000 $115.000 $165.000 $260.000
Constructor 500 $20.000 $125.000 $235.000 $300.000
Documento en garantía por Constructo 600 $20.000 $125.000 $235.000 $300.000
2.500.000 Geodimiter 600 $22.000 $125.000 $235.000 $300.000
Trimble 3605 $22.000 $135.000 $260.000 $350.000
Trimble 605M $22.000 $135.000 $260.000 $350.000
Topcon 3007 $22.000 $135.000 $260.000 $350.000

NIVEL Automático NEDO N-24 $3.500 $18.000 $26.000 $35.000


Incluye NEDO X-24 $3.500 $18.000 $26.000 $35.000
Trípode y mira BERGER N-24 $3.500 $18.000 $26.000 $35.500
PENTAX AL-320 $4.000 $20.000 $30.000 $42.000
Documento en garantía por 250.000
132

Si se restan los honorarios de la cotización 1 con los de la cotización 2 se


obtendrán $600.000 que corresponde al valor que se esta cobrando en un
levantamiento geodésico realizado en tres días. Ahora si al resultado anterior se
le resta el costo debido al arriendo del instrumental necesario ($216.000 por los
tres días) se ontendrán $384.000 que corresponderá al costo explicado por
transporte, alarife/s, otros. Con estos datos es posible construir una nueva
cotización para la densificación de puntos.

COTIZACION 3: Densificación GPS y aplicación modelo matemático para


la obtención de altura ortométrica.

Especificaciones de la ejecución del trabajo:

• Toma de puntos señalados, monumentados y medidos con GPS


Geodésico de doble frecuencia, con lo cual se obtendrá coordenadas y
altura elipsoidal de los puntos.

• Se aplicará modelo matemático, construido con datos entregados por el


mandante, para conocer la altura ortométrica de los puntos densificados.

• La duración del trabajo en terreno será de 3 días y 2 días para la


confección de plano e informe.

• La presentación del trabajo se entregará en tres copias de planos a la


escala 1:2000 y con respaldo de los archivos digitales en Autocad 2004 y
2007.

• Se hará entrega de planillas en formato Excel donde estarán los


descriptores, coordenadas y alturas de los puntos tomados en terreno.
133

• Cada punto tendrá sus correspondientes monografías (coordenadas y


altura)

Honorarios:

Los honorarios para la densificación GPS y aplicación modelo matemático para


la obtención de altura ortométrica, tiene un costo de $850.000 más el 10% de
impuesto.

Presentación:

Expediente con la siguiente información:

• Informe geodésico.

• 3 copias de planos.

• CD que contiene archivos digitales de los planos, monografías e informe.


134

2
Anexo: Distribución de la ‫ א‬.
2
Fuente: E.S. Pearson, Tables of the Percentage Points of ‫ א‬the Distribution, Biometrika, vol.32
135

Anexo: Distribución de la t-student


Fuente: E.S. Pearson, Critical values of Student's t Distribution, Biometrika, vol. 32
136

Anexo: Distribución de la F (parte1)


Fuente: E.S. Pearson, Tables of the Percentage Points of the Inverted Beta (F) Distribution, Biometrika, vol.32
137

Anexo: Distribución de la F (parte2)


Fuente: E.S. Pearson, Tables of the Percentage Points of the Inverted Beta (F) Distribution, Biometrika, vol32.
138

Anexo: Distribución de la F (parte3)


Fuente: E.S. Pearson, Tables of the Percentage Points of the Inverted Beta (F) Distribution, Biometrika, vol2.
139

BIBLIOGRAFIA.

- Gunter Seeber, 2003, Satellite Geodesy, Walter de Gruyter, Berlin-New York


2003

- Zepeda Rene, 2004, Geodesia Satelital.

- Memoria de título, 2003, “Estudio y aplicación de modelos geoidales como


marco de referencia vertical para Chile” Garafulic Caviedes, Pedro Andrés.

- Manual de Carreteras VOL. II, 2001, Dirección de Vialidad, Ministerio de Obras


Publicas, Chile.

- LEN Y ASOCIADOS Ingenieros Consultores, H. Lange y R. Zepeda, Manual


de procedimiento para mejorar la precisión en las determinaciones altimétricas
mediante GPS en Chile usando un modelo Geoidal.

- Zakatov, P. S. Curso de Geodesia Superior, Editorial Rubiños 1860 S.A.

- Peter Vanícek, Marcelo Santos, Robert Tenzer, Antonio Hernández Navarro,


Algunos Aspectos Sobre Alturas Ortométricas y Normales

- Ignacio alonso Fernández-coppel, Las coordenadas geográficas y la


proyección UTM. El Datum, Universidad de Valladolid.

- Richard L. Burden y J.Douglas Faires, Análisis Numérico, Editorial Thomson


Learning Séptima Edición.

- Donald J. Koosis, Elementos de inferencia estadística, Editorial Limusa.


140

- Sistemas Geodésicos. Comité Nacional de la Unión Geodésica y Geofísica


Internacional .1era edición 1999.

- Technical report nº12 (“http://www.iers.org”)


- Publicaciones SIRGAS (http://www.sirgas.org)

-Documentos y revistas, departamento de matemáticas, Universidad de


Cataluña, (“http://dm.udc.es/mate/”)

- Alejandro Vasallo y Juan M. Vilar Fernández, 2006, Bancos y Cajas de


Ahorro: modelización del margen de beneficio por regresión múltiple. Análisis
comparativo ,

-Memoria de título, Universidad Técnica Metropolitana, 2006, “Diagnóstico del


uso de proyecciones transversales de Mercator en escalas urbanas” Sebastian
Fuentes.

-Memoria de título, Universidad de Santiago de Chile, 2003, “Evaluación de la


aplicación de un huso TM para chile continental, aplicable a cartografía del
ministerio de bienes nacionales” Fernando Millar.

-Memoria de título, Universidad de Santiago de Chile, 2003, “Estimación de los


parámetros de transformación entre los sistema de referencia WGS-84 y PSAD-
56 para una zona de Calama” Marcela Ramírez, Diego Ortiz.

- Memoria de título, Universidad de Santiago de Chile, 2003, “Metodología y


desarrollo para la georreferenciación de un proyecto vial cuesta Lo Prado”
María José Herrera, José Salas.

También podría gustarte