Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MÉTODOS ESTADÍSTICOS
INFORME 3
DOCENTE
ENRIQUE PARRA BONILLA
2023-1
INTRODUCCIÓN:
Según los resultados obtenidos en todos los análisis realizados en los modelos de regresión
se obtiene una relación entre el diámetro de la copa y la altura del árbol que son una
medidas fundamentales para describir la característica de un árbol, la tabla cruzada permite
encontrar las características dominantes en este caso los tipos de árboles usando las
variables de cobertura y copa en donde los árboles aparasolados son los que predominan
en el conjunto de datos y los sembrados en césped igualmente están en mayor proporción.
En los intervalos de confianza para la media los valores obtenidos no se encuentran dentro
de ningún intervalo utilizado que fueron de 90%,95%99%, obteniendo una distribución con
sesgo a la izquierda lo que significa que la media está sobrestimada de la verdadera media
poblacional. En los intervalos de confianza para la varianza se observaron datos diferentes
para cada variable, en la variable altura de árbol el parámetro poblacional cae dentro de los
intervalos generando una mayor dispersión de datos y acercándose al valor real, la variable
diámetro copa El parámetro poblacional es menor a los límites inferiores de los intervalos
por ende los datos son más homogéneos, tienen menos dispersión respecto a la media
muestral. Pruebas de hipótesis para la media permite rechazar la hipótesis nula por eso se
sugiere que para la variable ‘diámetro de copa’ la media poblacional sea igual a 5,2573,
para la variable altura árbol se sugiere que la media poblacional “µ” para la variable ‘altura
del árbol’ sea mayor que 6,2421 ya se rechaza la hipótesis nula, La prueba de hipótesis de
diferencia de medias en la cual primero de debe hacer la prueba de diferencia de medias
para así poder seguir dependiendo del valor t obtenido en la prueba de varianzas para la
variable diámetro copa Los datos no presentan suficiente evidencia para suponer varianzas
iguales con una significancia de 0.05, lo que permite deducir que no se presenta la
suficiente evidencia para rechazar que la media del diámetro de la copa para la categoría
jardín es igual a la media del diámetro de la copa para la categoría vegetación emergente.
MODELOS DE REGRESIÓN:
Se emplearon modelos de regresión para describir la manera de que la variable Diámetro
copa describe la variable Altura árbol que se miden ambas en metros.
Modelo 1
Modelo 1:
Pendiente 0,7246
Intercepto 0,8802
𝑅
2 0,58=58%
Conclusión: Este modelo valida que las variables Diámetro copa y altura del árbol
guardan una relación entre ellas ya que la variable altura árbol explica a la variable
diámetro copa en un 58%
Modelo 2
Modelo 2:
Pendiente 4,859
Intercepto -3,031
𝑅
2 0,5917=59,17%
Pendiente: 4,859
Intercepto: -3,031
Diámetro copa= 4,859(ln(altura árbol)-3,031
2
𝑅 = 0, 5917 = 59, 17%
Conclusión: En este modelo se realizó una transformación en la variable altura del
árbol utilizando el logaritmo natural de la variable, esto se hizo para buscar una
mejor agrupación de los datos dando como resultado que si tuvo una mejor
agrupación de datos con un 59,17%.
Modelo 3
Modelo 3:
Pendiente 3,894
Intercepto -4,095
𝑅
2 0,6019=6
0,19%
Modelo 4
Modelo 4:
Pendiente 0,8038
Intercepto 0,2937
𝑅
2 0;5959=59,59%
Conclusión: Para este modelo se realizaron transformaciones para las dos variables
para el diámetro de copa se usó la raíz cuadrada y para la altura árbol se usó
igualmente la raíz cuadrada, para buscar una mejora agrupación de datos dando
como resultado un 59,59%.
Modelo 5
Modelo 5:
Pendiente 1,0173
Intercepto 0,4883
𝑅
2 0;6021=60,21%
Conclusión: Para este modelo se realizaron transformaciones para las dos variables
para el diámetro de copa se usó la raíz cuadrada y para la altura árbol se usó el
logaritmo natural, para buscar una mejora agrupación de datos dando como
resultado la mejor agrupación de todos los modelos con un 60,21%.
De todos los modelos analizados se logra concluir que las dos variables guardan
una estrecha relación para conocer datos acerca de los árboles.
TABLA CRUZADA:
Para realizar los intervalos de confianza para la media se utilizó una muestra que contenía
el 70% de los datos de toda la base de datos y la población, con el fin de obtener los
valores de desviación poblacional, media poblacional, desviación muestral, media muestral
de las dos variables cuantitativas continuas “Diámetro Copa” y “Altura del Árbol”. Luego se
definen los valores críticos para cada intervalo, en el cual se utiliza una distribución normal.
Y con esos datos reemplazarlos en la ecuación para construir los intervalos de confianza
para la media con desviación poblacional conocida :
➔ Intervalo de confianza para la media de la variable “ALTURA DEL ÁRBOL”
DATOS:
DATOS:
DATOS:
DATOS:
CONCLUSIÓN: El parámetro poblacional es menor a los límites inferiores de los intervalos
de confianza por ende los datos son más homogéneos y tienen menos dispersión de lo
esperado respecto a la media muestral.
Decisión: No se rechaza 𝐻0
Conclusión: Los datos que presenta la muestra son suficiente evidencia para que sea
posible aceptar la hipótesis nula por esa razón se sugiere que la media poblacional para la
variable ‘diámetro copa’ sea igual a 5,2573.
Decisión: Se rechaza 𝐻0
Conclusión: Los datos que contiene la muestra no presentan suficiente evidencia que
permita aceptar la hipótesis nula, por lo tanto se sugiere que la media poblacional “µ” para la
variable ‘altura del árbol’ sea mayor que 6,2421.
PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE MEDIAS:
Para determinar las hipótesis para la diferencia de medias se realizó dos filtrados de la
muestra correspondiente a la segunda variable nominal “Cobertura”. Obteniendo dos
submuestras las cuales, una de ellas contiene la segunda categoría “Jardín” y la otra
contiene la cuarta categoría “Vegetación Emergente” de la variable nominal. Para llevar a
cabo las diferentes pruebas es necesario calcular el tamaño, la media muestral y desviación
muestral para las dos submuestras con ello poder hacer el test para la varianzas y según el
resultado de este poder realizar una prueba t para la diferencia de medias.
Decisión: Se rechaza 𝐻0
Conclusión: Los datos no presentan suficiente evidencia para suponer varianzas iguales con
una significancia de 0.05
Decisión: No se rechaza 𝐻0
Conclusión: No se presenta la suficiente evidencia para rechazar que la media del diámetro
de la copa para la categoría jardín es igual a la media del diámetro de la copa para la
categoría vegetación emergente.
Decisión: No se rechaza 𝐻0
Conclusión: Los datos presentan suficiente evidencia para suponer varianzas iguales
con una significancia de 0.05
Decisión: No se rechaza 𝐻0
Conclusión: No se presenta la suficiente evidencia para rechazar que la media de la
altura del árbol para la categoría jardín es igual a la media de la altura del árbol para
la categoría vegetación emergente.
CONCLUSIÓN:
1. La regresión permite encontrar relación entre dos variables una dependiente y la otra
independiente que en este caso fue la relación del diámetro de la copa con la altura
del árbol en la cual de todos los modelos realizados se encuentra que si tiene una
relación significativa estas variables y se puede verificar que los modelos obtenidos
concuerdan con los datos analizados.
2. Al conocer las características significativas de los individuos permite conocer su
entorno, el ecosistema local y que implicaciones tienen en la estética del paisaje de
la ciudad de Cali como el diseño visual y ambiental de la ciudad.
3. Mediante los intervalos de confianza se permite conocer de qué manera los datos
muestrales permiten conocer el verdadero valor del parámetro poblacional, en este
caso los valores estimados se encontraban alejados del valor esperado.
4. Al realizar diferentes pruebas de hipótesis se hace una suposición sobre el valor de
un parámetro poblacional y mediante el análisis estadístico de la muestra fue posible
determinar una decisión según las evidencias de la muestra.