Está en la página 1de 12

“Universidad Nacional de Huancavelica”

EAP: INGENIERIA CIVIL


EXAMEN FINAL DE ESTADISTICA DESCRIPTIVA

a) ¿Cuál es la hipótesis de investigación o estudio detrás de los datos? ¿Crees que exista una relación u
asociación entre las variables registradas? Identifica la variable dependiente e independiente. Establece
y describe el modelo matemático que mejor se ajusta a la relación entre las variables.
La hipótesis de investigación fue como varia el caudal anual (m3/s) de acuerdo a la intensidad máxima
de precipitación. Por ejemplo que pasa si el caudal anual aumenta progresivamente o disminuye, el
factor principal tenía que ser la variable independiente llamado precipitación.
Teniendo una relación entre el caudal y la precipitación una proporción directamente proporcional.
Q=“Caudal anual (m3/s)”; es la variable dependiente porque depende de otras variables como por
ejemplo, de la variación de intensidad máxima de precipitación (cm/24h).I=“Intensidad máxima de
precipitación (cm/24h)”; es la variable independiente como su nombre mismo lo menciona no
depende de otras variables existentes.
b) Crea una base de datos que sea leída correctamente por R y realiza un análisis (gráfico) exploratorio
de los datos. Interpreta.
La base de datos se llama "(base_de_datos_)”, analizando las variables intensidad máxima de
precipitación (cm/24h) y la variable Caudal anual (m3/s); al analizar los datos del ambas variables
podemos llegar a una conclusión y gracias a los comandos en R tenemos varias tablas a continuación.

La línea negra representa la mediana de todos los datos de la variable intensidad


máxima de precipitación.

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL

La línea negra representa el dato medio de la variable caudal anual

Usando "pairs", podemos examinar las relaciones entre pares de variables, además
podemos observar variables que se parecen (gráficamente) estar relacionadas.

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL

c) Realiza la comprobación de los supuestos previos (homogeneidad de varianzas/normalidad) al


análisis de los datos. Interpreta las salidas resultantes.
 Para la variable Caudal anual (m3/s) no hay normalidad ya que el resultado es menor que la
probabilidad (0.05).

 Ahora para la variable intensidad máxima de precipitación (cm/24h) si existe la normalidad


porque es mayor a la probabilidad (0.05).

 Haciendo un análisis tanto para la variable caudal anual y la intensidad máxima de precipitación la
homogeneidad en ambas son iguales por lo tanto son homogéneas.

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL

d) Calcula el valor del coeficiente de correlación. Interpreta.

Calculamos la correlación entre las variable “Caudal anual (m3/s)” (Q) y “Intensidad máxima de
precipitación (cm/24h)” (I), hay baja correlación entre las variables de caudal anual e intensidad
máxima de precipitación ya que se aleja de la unidad; y si se acercara a la unidad habría la mayor
certeza de tener una correlación excelente.

e) Calcula el valor del coeficiente de intercepción y coeficiente de regresión. Interpreta.

Coeficiente de regresión es igual a b1=-39.6934


Coeficiente de intercepción es igual a b0= 118.9717

f) Realiza un ajuste lineal, establece la Ecuación de Regresión y añade la recta de la ecuación lineal.
Interpreta.
La ecuación de la regresión: Y = b0 + b1x + e

Q=118.9717+ (-39.6934)*I
Q=“Caudal anual (m3/s)”; es la variable dependiente.

I=“Intensidad máxima de precipitación (cm/24h)”; es la variable independiente.

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL

La recta de la ecuación lineal.

g) ¿Puedes predecir los valores de Y usando otros datos distintos a los registrados inicialmente?

h) ¿En qué medida la varianza de Y es explicada por la variación de X?

Y = b0 + b1x + e

Y= variable respuesta (Variable dependiente)


x= variable independiente (Variable regresora)
b0= coeficiente de intercepción o intercepto
b1= coeficiente de regresión o pendiente
e = error
La variable independiente es “Intensidad máxima de precipitación (cm/24h)” (I)
La variable dependiente es “Caudal anual (m3/s)

i) Realiza el diagnóstico del modelo lineal. Interpreta.

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL
Es un ajuste lineal porque hay mayor concentración de variables en la recta lineal
equivalente al 61% aproximadamente, teniendo un error inferior al 50%; equivalente al
39% de error.
Por lo tanto hay mayor probabilidad de estar seguros de que es un modelo lineal.

j) Indica que logras con los comandos o líneas de comando del script de R, para cada uno de las salidas
obtenidas.

Finalmente podemos concluir o resumir de estadísticas de ajuste de modelo lineal con "lm" y
"summary".

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL

2. La pavimentación con asfalto debe ser medida respecto a su calidad. Los datos de la tabla muestran
un experimento para determinar el efecto de las burbujas de aire sobre la resistencia del asfalto. Para
fines del experimento, las burbujas se controlaron en tres niveles. bajo (2-4 %), medio (4-6 %) y alto
(6-8 %).

a. ¿Cuál es la hipótesis de investigación o estudio detrás de los datos? Identifica la variable dependiente
e independiente. Establece y describe el modelo matemático que mejor se ajusta a la relación entre
las variables. Identifica las fuentes de variación.

La variable dependiente es el asfaltado


La variable independiente es burbuja de aires

b. Crea una base de datos que sea leída correctamente por R y realiza un análisis (gráfico) exploratorio
de los datos. Interpreta.

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL

Grafica utilizando el comando “pairs” podemos examinar las relaciones entre pares de
variables, además podemos observar variables que se parecen (gráficamente) estar
relacionadas.

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL

Usando el comando “plot” podemos correlacionar burbujas de aire bajo (2.4%) y aire medio (4-
6%).

Utilizando el comando “ggplot”, y ploteamos bajo vs medio con un ajuste de regresión lineal
usando ggplot y method = "lm"

c. Realiza la comprobación de los supuestos previos (homogeneidad de varianzas/normalidad) al análisis


de los datos. Interpreta las salidas resultantes.

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL

d. Usando el método de Cuadrados Mínimos. Realiza los cálculos de los grados de libertad, sumas
de cuadrados, cuadro medio, valor de la prueba de F y p-valor. Interpreta la salida.

e. Dado el p-valor encontrado ¿Se rechaza o no la Ho?

f. ¿Es conveniente realizar una prueba de separación de medias como la de Tukey? ¿Por qué
tomarías esta decisión?

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA


“Universidad Nacional de Huancavelica”
EAP: INGENIERIA CIVIL

g. ¿Cuál de los niveles de burbujas estudiados conduce a tener una mejor resistencia del
pavimento?

h. Indica que logras con los comandos o líneas de comando del script de R, para cada uno de las
salidas obtenidas.

CICLO: III CATEDRA: ESTADISTICA DESCRIPTIVA