Está en la página 1de 12

UNIVERSIDAD DE LA SALLE

MÉTODOS ESTADÍSTICOS

INFORME 3

MERCY ALEJANDRA VALERO MALAGÓN


JUAN SEBASTIAN GOMEZ RODRIGUEZ

DOCENTE
ENRIQUE PARRA BONILLA

2023-1
INTRODUCCIÓN:
Según los resultados obtenidos en todos los análisis realizados en los modelos de regresión
se obtiene una relación entre el diámetro de la copa y la altura del árbol que son una
medidas fundamentales para describir la característica de un árbol, la tabla cruzada permite
encontrar las características dominantes en este caso los tipos de árboles usando las
variables de cobertura y copa en donde los árboles aparasolados son los que predominan
en el conjunto de datos y los sembrados en césped igualmente están en mayor proporción.
En los intervalos de confianza para la media los valores obtenidos no se encuentran dentro
de ningún intervalo utilizado que fueron de 90%,95%99%, obteniendo una distribución con
sesgo a la izquierda lo que significa que la media está sobrestimada de la verdadera media
poblacional. En los intervalos de confianza para la varianza se observaron datos diferentes
para cada variable, en la variable altura de árbol el parámetro poblacional cae dentro de los
intervalos generando una mayor dispersión de datos y acercándose al valor real, la variable
diámetro copa El parámetro poblacional es menor a los límites inferiores de los intervalos
por ende los datos son más homogéneos, tienen menos dispersión respecto a la media
muestral. Pruebas de hipótesis para la media permite rechazar la hipótesis nula por eso se
sugiere que para la variable ‘diámetro de copa’ la media poblacional sea igual a 5,2573,
para la variable altura árbol se sugiere que la media poblacional “µ” para la variable ‘altura
del árbol’ sea mayor que 6,2421 ya se rechaza la hipótesis nula, La prueba de hipótesis de
diferencia de medias en la cual primero de debe hacer la prueba de diferencia de medias
para así poder seguir dependiendo del valor t obtenido en la prueba de varianzas para la
variable diámetro copa Los datos no presentan suficiente evidencia para suponer varianzas
iguales con una significancia de 0.05, lo que permite deducir que no se presenta la
suficiente evidencia para rechazar que la media del diámetro de la copa para la categoría
jardín es igual a la media del diámetro de la copa para la categoría vegetación emergente.

MODELOS DE REGRESIÓN:
Se emplearon modelos de regresión para describir la manera de que la variable Diámetro
copa describe la variable Altura árbol que se miden ambas en metros.
Modelo 1
Modelo 1:

Pendiente 0,7246

Intercepto 0,8802

𝑅
2 0,58=58%

Diámetro copa= 0,7246(Altura árbol) +0,8802

Conclusión: Este modelo valida que las variables Diámetro copa y altura del árbol
guardan una relación entre ellas ya que la variable altura árbol explica a la variable
diámetro copa en un 58%
Modelo 2

Modelo 2:

Pendiente 4,859

Intercepto -3,031

𝑅
2 0,5917=59,17%

Pendiente: 4,859
Intercepto: -3,031
Diámetro copa= 4,859(ln(altura árbol)-3,031
2
𝑅 = 0, 5917 = 59, 17%
Conclusión: En este modelo se realizó una transformación en la variable altura del
árbol utilizando el logaritmo natural de la variable, esto se hizo para buscar una
mejor agrupación de los datos dando como resultado que si tuvo una mejor
agrupación de datos con un 59,17%.
Modelo 3

Modelo 3:

Pendiente 3,894

Intercepto -4,095

𝑅
2 0,6019=6
0,19%

Diámetro copa=3, 894( 𝐴𝑙𝑡𝑢𝑟𝑎 á𝑟𝑏𝑜𝑙) + (− 4, 095)


Diámetro copa=3, 894( 𝐴𝑙𝑡𝑢𝑟𝑎 á𝑟𝑏𝑜𝑙) − 4, 095

Conclusión: En este modelo se realizó una transformación en la variable altura del


árbol utilizando la raíz cuadrada de la variable, esto se hizo para buscar una mejor
agrupación de los datos dando como resultado que si tuvo una mejor agrupación de
datos que los dos modelos anteriores con 60,19%.

Modelo 4
Modelo 4:

Pendiente 0,8038

Intercepto 0,2937

𝑅
2 0;5959=59,59%

𝐷𝑖𝑎𝑚𝑒𝑡𝑟𝑜 𝑐𝑜𝑝𝑎 = 0, 8038 𝐴𝑙𝑡𝑢𝑟𝑎 á𝑟𝑏𝑜𝑙 + 0, 2937


2
Diámetro copa=(0, 8038 𝐴𝑙𝑡𝑢𝑟𝑎 á𝑟𝑏𝑜𝑙 + 0, 2937)

Conclusión: Para este modelo se realizaron transformaciones para las dos variables
para el diámetro de copa se usó la raíz cuadrada y para la altura árbol se usó
igualmente la raíz cuadrada, para buscar una mejora agrupación de datos dando
como resultado un 59,59%.
Modelo 5

Modelo 5:

Pendiente 1,0173

Intercepto 0,4883

𝑅
2 0;6021=60,21%

𝐷𝑖𝑎𝑚𝑒𝑡𝑟𝑜 𝑐𝑜𝑝𝑎=1,0173(ln(Altura árbol))+0,4883


2
Diámetro copa=(1, 0173(𝑙𝑛(𝐴𝑙𝑡𝑢𝑟𝑎 á𝑟𝑏𝑜𝑙)) + 0, 4883)

Conclusión: Para este modelo se realizaron transformaciones para las dos variables
para el diámetro de copa se usó la raíz cuadrada y para la altura árbol se usó el
logaritmo natural, para buscar una mejora agrupación de datos dando como
resultado la mejor agrupación de todos los modelos con un 60,21%.
De todos los modelos analizados se logra concluir que las dos variables guardan
una estrecha relación para conocer datos acerca de los árboles.
TABLA CRUZADA:

- Análisis Horizontal: De acuerdo al tipo de copa, para la categoría Aparasolada se


obtiene que el 82% de los individuos tienen césped como tipo de cobertura y el 12%
tienen piso duro como tipo de cobertura. Para la categoría columnar el porcentaje
más representativo fue del 97% el cual corresponde a que los individuos tienen una
cobertura de tipo “césped”. Para la categoría cónica se obtuvo que el 85% de los
individuos tienen una cobertura de tipo césped y el 41% tiene una cobertura de tipo
Piso duro. Para la categoría Globosa se obtiene que el 85% de los individuos
poseen una cobertura de tipo césped y el 10% poseen una cobertura de tipo piso
duro. Para la categoría irregular el 87% de los individuos poseen una cobertura de
tipo césped y se obtuvo que para la categoría ninguna el 100% de los individuos
tienen césped como tipo de cobertura.

- Análisis Vertical: De acuerdo al tipo de cobertura de los individuos, para la categoría


césped se obtuvo que el 44% de los individuos tienen copa aparasolada y el 37%
tienen copa globosa. Para la categoría Jardín el 77% de los individuos poseen una
copa de tipo aparasolada. Para la categoría Piso duro se obtiene que el 52% posee
una copa aparasolada y el 35% posee una copa globosa. Y para la categoría
Vegetación emergente el 44% de los individuos tienen una copa de tipo globosa y el
39% tienen una copa de tipo aparasolada.
- Las categoría de ‘Aparasolada’ al ser las más representativas de la población de
acuerdo al tipo de copa significa que es una característica significativa de individuos
o árboles de clima cálido, lo cual concuerda ya que el censo fue en la ciudad de Cali.
Y la categoría ‘Césped’ al tipo de cobertura significa que la mayor parte de los
árboles están sembrados alrededor de espacios verdes y la otra categoría
significativa ‘piso duro’ significa que están sembrados en los andenes.

INTERVALOS DE CONFIANZA PARA LA MEDIA:

Para realizar los intervalos de confianza para la media se utilizó una muestra que contenía
el 70% de los datos de toda la base de datos y la población, con el fin de obtener los
valores de desviación poblacional, media poblacional, desviación muestral, media muestral
de las dos variables cuantitativas continuas “Diámetro Copa” y “Altura del Árbol”. Luego se
definen los valores críticos para cada intervalo, en el cual se utiliza una distribución normal.
Y con esos datos reemplazarlos en la ecuación para construir los intervalos de confianza
para la media con desviación poblacional conocida :
➔ Intervalo de confianza para la media de la variable “ALTURA DEL ÁRBOL”

DATOS:

CONCLUSIÓN: El parámetro poblacional no cae dentro de ningún intervalo de


confianza, pero al que más se acerca es del 99% sin embargo en todos los
intervalos está por fuera limite inferior hacia la derecha esto quiere decir que el valor
poblacional “µ” está sobreestimado de la verdadera media poblacional y que tiene un
comportamiento de sesgo a la izquierda.

➔ Intervalo de confianza para la media de la variable “DIÁMETRO COPA”

DATOS:

CONCLUSIÓN: El parámetro poblacional no cae dentro de ningún intervalo de


confianza, pero al que más se acerca es del 99% sin embargo en todos los
intervalos está por fuera limite inferior hacia la derecha esto quiere decir que el valor
poblacional “µ” está sobreestimado de la verdadera media poblacional y que tiene un
comportamiento de sesgo a la izquierda.

INTERVALOS DE CONFIANZA PARA LA VARIANZA:

Para realizar intervalos de confianza para la varianza se utilizó la muestra y la población, de


allí se calcula el valor de los grados de libertad expresados como: y la desviación
muestral para cada una de las variables cuantitativas continuas “Diámetro Copa” y “Altura
del Árbol”. De igual manera, se obtienen los valores críticos usando una distribución de chi
cuadrado y con ello construir los tres intervalos de confianza con la ecuación:

➔ Intervalo de confianza para la varianza de la variable “ALTURA DE ÁRBOL”

DATOS:

CONCLUSIÓN: El parámetro poblacional está dentro de los límites de los intervalos


de confianza por ende los datos presentan una mayor dispersión y tienen certeza
respecto al valor real.

➔ Intervalo de confianza para la varianza de la variable “DIÁMETRO COPA”

DATOS:
CONCLUSIÓN: El parámetro poblacional es menor a los límites inferiores de los intervalos
de confianza por ende los datos son más homogéneos y tienen menos dispersión de lo
esperado respecto a la media muestral.

PRUEBA DE HIPÓTESIS PARA LA MEDIA:

Para determinar prueba de hipótesis para la media se realizó un filtrado de la muestra


teniendo en cuenta la primera categoría “Aparasolada”de la primera variable nominal
“Copa” e igualmente utilizando la tercera categoría “Piso duro” de la segunda variable
nominal “Cobertura”. Para el desarrollo de esta prueba fue necesario calcular el tamaño,
desviación y la media tanto poblacional como muestral. Con ello poder plantear las
hipótesis, el nivel de significancia y el valor crítico teniendo en cuenta que se trabaja con
una distribución de t student.
➔ Prueba de hipótesis para la media de la variable “DIÁMETRO COPA”

Decisión: No se rechaza 𝐻0
Conclusión: Los datos que presenta la muestra son suficiente evidencia para que sea
posible aceptar la hipótesis nula por esa razón se sugiere que la media poblacional para la
variable ‘diámetro copa’ sea igual a 5,2573.

➔ Prueba de hipótesis para la media de la variable “ALTURA DEL ÁRBOL ”

Decisión: Se rechaza 𝐻0
Conclusión: Los datos que contiene la muestra no presentan suficiente evidencia que
permita aceptar la hipótesis nula, por lo tanto se sugiere que la media poblacional “µ” para la
variable ‘altura del árbol’ sea mayor que 6,2421.
PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE MEDIAS:

Para determinar las hipótesis para la diferencia de medias se realizó dos filtrados de la
muestra correspondiente a la segunda variable nominal “Cobertura”. Obteniendo dos
submuestras las cuales, una de ellas contiene la segunda categoría “Jardín” y la otra
contiene la cuarta categoría “Vegetación Emergente” de la variable nominal. Para llevar a
cabo las diferentes pruebas es necesario calcular el tamaño, la media muestral y desviación
muestral para las dos submuestras con ello poder hacer el test para la varianzas y según el
resultado de este poder realizar una prueba t para la diferencia de medias.

➔ Prueba de diferencia de varianzas de la variable “DIÁMETRO COPA ”

Decisión: Se rechaza 𝐻0
Conclusión: Los datos no presentan suficiente evidencia para suponer varianzas iguales con
una significancia de 0.05

➔ Prueba de diferencia de medias de la variable “DIÁMETRO COPA ”

Decisión: No se rechaza 𝐻0
Conclusión: No se presenta la suficiente evidencia para rechazar que la media del diámetro
de la copa para la categoría jardín es igual a la media del diámetro de la copa para la
categoría vegetación emergente.

➔ Prueba de diferencia de varianzas de la variable “ALTURA DEL ÁRBOL ”

Decisión: No se rechaza 𝐻0
Conclusión: Los datos presentan suficiente evidencia para suponer varianzas iguales
con una significancia de 0.05

➔ Prueba de diferencia de medias de la variable “ALTURA DEL ÁRBOL ”

Decisión: No se rechaza 𝐻0
Conclusión: No se presenta la suficiente evidencia para rechazar que la media de la
altura del árbol para la categoría jardín es igual a la media de la altura del árbol para
la categoría vegetación emergente.

CONCLUSIÓN:
1. La regresión permite encontrar relación entre dos variables una dependiente y la otra
independiente que en este caso fue la relación del diámetro de la copa con la altura
del árbol en la cual de todos los modelos realizados se encuentra que si tiene una
relación significativa estas variables y se puede verificar que los modelos obtenidos
concuerdan con los datos analizados.
2. Al conocer las características significativas de los individuos permite conocer su
entorno, el ecosistema local y que implicaciones tienen en la estética del paisaje de
la ciudad de Cali como el diseño visual y ambiental de la ciudad.
3. Mediante los intervalos de confianza se permite conocer de qué manera los datos
muestrales permiten conocer el verdadero valor del parámetro poblacional, en este
caso los valores estimados se encontraban alejados del valor esperado.
4. Al realizar diferentes pruebas de hipótesis se hace una suposición sobre el valor de
un parámetro poblacional y mediante el análisis estadístico de la muestra fue posible
determinar una decisión según las evidencias de la muestra.

También podría gustarte