Está en la página 1de 4

TRABAJO FINAL

ESTADÍSTICA
Sofía Del Mar Rosero
Susana Ríos Zuluaga
RESUMEN
R es un lenguaje de programación formado por un conjunto de herramientas
muy flexibles que pueden ampliarse fácilmente mediante paquetes, librerías o
definiendo nuestras propias funciones.
Este lenguaje es muy utilizado a la hora de realizar análisis estadísticos ya que
es una herramienta para todo tipo de procesamiento y manipulación de datos.
Por otro lado, el análisis estadístico nos sirve para recopilar, explorar y
presentar grandes cantidades de datos para descubrir patrones y tendencias
implícitas. Gracias a este calculamos varias medidas que nos sirven para la
recopilación de datos de estudio de las diferentes muestras extraídas como el
cálculo de la media aritmética entre valores y de la desviación estándar,
también podemos hacer visualizaciones gráficas, mediante histogramas,
gráficos circulares, barras, etc., podemos sacar la correlación, que mide si
existe una relación entre variables diferentes, entre otros.

INTRODUCCIÓN
El presente trabajo de investigación consiste en el cálculo de análisis
estadísticos que se les realiza a los datos obtenidos de un estudio hidráulico a
lo largo de un río.
Este análisis se elaboró en base a la metodología de estudio de cada caso,
utilizamos el lenguaje de programación R que nos ayudó en gran parte a
ejecutar los cálculos requeridos para obtener la información pertinente que nos
secunda para evaluar la tendencia futura de los diferentes factores que influyen
en el caudal.

DATOS Y MÉTODOS
Los datos son tomados de un formato de Excel enviado por la docente a cargo
del curso. Los análisis se realizaron en base a la metodología aprendida en
clase, con ayuda de sitios web y videos donde se encontraba la información
adecuada para efectuar los cálculos pedidos.
Lo mas importante a la hora de realizar este trabajo fue el lenguaje de
programación R ya que gracias a este pudimos simplificar y efectuar la mayoría
de los cálculos, realizar gráficas, ejecutar funciones de una manera mas
directa, entre otros.
RESULTADOS Y ANÁLISIS
Realizando el respectivo análisis para cada problema planteado se encontraron
los siguientes resultados:
a) Se desarrollaron de forma adecuada y eficaz los análisis descriptivos
para cada variable con su respetiva gráfica en R.

b) La relación más fuerte entre las variables es entre la precipitación y el


caudal, debido a que el coeficiente de correlación de Pearson es el más
cercano a 1, con una relación directa fuerte.

Por otro lado, las relaciones entre las variables temperatura-precipitación


y temperatura-caudal, son relaciones inversas, que no son tan fuertes
como la relación precipitación-caudal.

c) Se realizo su respectivo gráfico de dispersión entre las variables de


mejor correlación en R.
Ecuación de regresión lineal:
Y=B0+B1*X
B1=0.03526233
B0=-0.4106361

d) La variable no sigue una distribución normal ya que tiene un sesgo a la


derecha entonces se le ajustó a una distribución lognormal.

Nivel de confianza =90%


0.3273592≤µ≤0.5950084

Nivel de confianza=95%
0.3015307≤µ≤0.62083

Nivel de confianza=99%
0.2507442≤µ≤0.6716234

El nivel de confianza del 90% ofrece mayor grado de precisión ya que el


nivel de confianza y la amplitud del intervalo varían conjuntamente de tal
forma que si tenemos un intervalo mas grande vamos a tener mayor
confianza de encontrar el verdadero valor, pero mayor imprecisión, de
manera inversa, si tenemos un intervalo más pequeño este ofrecerá una
estimación mas precisa, pero con mas probabilidad de error.

e) Realizando los cálculos en R: no hay evidencia suficiente para rechazar


la hipótesis nula.
f) Realizando los cálculos en R: como el estadístico de prueba es mayor
que el valor crítico se rechaza la hipótesis nula, además, la función de
prueba de Kolmogorov-Smirnov arrojó el mismo resultado.
CONCLUSIONES
Después de realizar los análisis correspondientes y utilizar los métodos ya
conocidos y mencionados con anterioridad, primeramente, se concluye que la
precipitación es la variable que más efecto tiene sobre el caudal haciendo que
este tenga mayor variación en sus factores, por otro lado, para trabajar con un
nivel de confianza más preciso trabajamos con 90% y de acuerdo con los
resultados se puede afirmar que la temperatura media mensual es de 14°C.
Los análisis estadísticos sacados de estas muestras nos permitieron saber los
comportamientos del caudal y las diferentes variables que pueden afectar en él,
así también se obtuvo información de gran ayuda para saber la propensión
futura de este.
R es un lenguaje de programación verdaderamente útil para realizar trabajos
con mucha variabilidad de datos que conlleven a cálculos complejos, ya que
este se encarga de simplificarlos en su gran mayoría, aparte de que tiene
diversas funciones que podemos utilizar para tomar las medidas que
necesitemos.

REFERENCIAS BIBLIOGRÁFICAS
https://cosmosweb.champlain.edu/people/stevens/WebTech/R/Chapter-3-R.pdf
https://www.rdocumentation.org/packages/pbdDMAT/versions/0.5-
1/topics/covariance
https://cran.r-project.org/web/packages/covr/covr.pdf
https://rpubs.com/bogotan/covarianza_correlacion
https://picandoconr.wordpress.com/2016/07/14/obtencion-aleatoria-de-valores-
rnorm/
https://www.rdocumentation.org/packages/graphics/versions/3.6.2/topics/par
http://www.sthda.com/english/wiki/abline-r-function-an-easy-way-to-add-
straight-lines-to-a-plot-using-r-software
https://rpubs.com/dsulmont/215884
https://bookdown.org/dietrichson/metodos-cuantitativos/test-de-normalidad.html
https://fhernanb.github.io/Manual-de-R/ic.html
https://fhernanb.github.io/Manual-de-R/ph.html

También podría gustarte