Documentos de Académico
Documentos de Profesional
Documentos de Cultura
R nació como una reimplementación de software libre del lenguaje S, adicionado con soporte
para ámbito estático. Se trata de uno de los lenguajes de programación más utilizados en
investigación científica, siendo además muy popular en los campos de aprendizaje automático
(machine learning), minería de datos, investigación biomédica, bioinformática y matemáticas
financieras. A esto contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con
funcionalidades de cálculo y graficación.
R es parte del sistema GNU y se distribuye bajo la licencia GNU GPL. Está disponible para
los sistemas operativos Windows, Macintosh, Unix y GNU/Linux.
4.1 CARACTERISTICAS
Funcional
Las funciones en R se pueden manipular de igual manera que los vectores. Asimismo, puedes
asignar las funciones a variables, almacenarlas en listas, devolverlas como resultados de otras
funciones o pasarlas como argumentos de otras funciones.
Orientado a objetos
El lenguaje R está orientado a objetos. R permite modelar conceptos del mundo real
relevantes a nuestro problema, representándolos como clases y objetos que podemos hacer
que interactúen entre sí.
Extensible
Los usuarios lo pueden extender definiendo sus propias funciones, aparte de las de las
numerosas bibliotecas preconstruidas que tiene. La mayor parte de ellas están escritas en R,
aunque para algoritmos computacionalmente exigentes es posible desarrollarlas en C, C++
o Fortran. Como es un proyecto colaborativo y abierto, los propios usuarios pueden publicar
paquetes que extienden su configuración básica.
Integrable
Existen librerías para R que permiten generar una gran variedad de gráficos, desde
la ggplot2 hasta otras más simples pero también potentes como corrplot.
Interpretado y no compilado
A diferencia de C, C++ ó Java, no tenemos que compilar nuestro código, sino que el intérprete
de R lo ejecuta directamente. Lo interesante es que muchas de sus rutinas más exigentes están
escritas en C ó C++, por lo que, sin darnos cuenta, se estará ejecutando código compilado en
esos lenguajes.
Basado en memoria
El lenguaje R mantiene todos los objetos que definimos en nuestro programa en la memoria
del ordenador. Por esta razón, es importante entender cómo gestiona la memoria, para poder
optimizar el código. Así se evitan copias innecesarias de objetos que pueden ralentizarlo.
4.2 FUNCIONES
Con este software se puede: estudiar correlaciones, ajustar modelos, crear gráficos 3D de
altísima calidad, aplicar árboles de decisión, realizar análisis clúster, análisis de componentes
principales, crear redes neuronales de predicción, etc.
Al igual que S, se trata de un lenguaje de programación, lo que permite que los usuarios lo
extiendan definiendo sus propias funciones. De hecho, gran parte de las funciones de R están
escritas en el mismo R, aunque para algoritmos computacionalmente exigentes es posible
desarrollar bibliotecas en C, C++ o Fortran que se cargan dinámicamente. Los usuarios más
avanzados pueden también manipular los objetos de R directamente desde código
desarrollado en C. R también puede extenderse a través de paquetes desarrollados por su
comunidad de usuarios.
Además, R puede integrarse con distintas bases de datos y existen bibliotecas que facilitan su
utilización desde lenguajes de programación interpretados como Perl y Python.
R también puede usarse como herramienta de cálculo numérico, campo en el que puede ser
tan eficaz como otras herramientas específicas tales como GNU Octave y su
equivalente privativo: MATLAB. Se ha desarrollado una interfaz, RWeka para interactuar
con Weka que permite leer y escribir ficheros en el formato arff y enriquecer R con los
algoritmos de minería de datos de dicha plataforma.
Finanzas
El Big Data y el análisis de datos se usan cada vez más en los últimos años en la industria
financiera. Con la utilización del lenguaje R, las entidades financieras pueden realizar
mediciones de riesgo a la baja, ajustar el rendimiento del mismo y ayudar en las
visualizaciones, creando gráficos de velas, de densidad o de reducción que sean fácilmente
entendibles por los usuarios.
El sector financiero también está aprovechando los procesos estadísticos de series temporales
de lenguaje R para modelar el movimiento de su mercado de valores, prediciendo los precios
de las acciones. Además, proporciona el contexto adecuado para la extracción de información
financiera, a través de sus paquetes (auantmod, pdfetch, TFX, pwt, etcétera).
Banca
Las entidades bancarias también utilizan R para modelar el riesgo de crédito y otras formas de
análisis de riesgos. Los bancos hacen un uso intensivo de corte hipotecario que les permite
adjudicarse la propiedad hipotecada, en caso de incumplimiento del préstamo.
Esta operación implica la distribución del precio de venta, la volatilidad de este y el cálculo del
déficit esperado. Para estas operaciones, en muchas ocasiones, el lenguaje R se utiliza con
herramientas propietarias como SAS.
Asistencia sanitaria
Con la ayuda de esta herramienta, estas empresas pueden procesar datos e información,
proporcionando un contexto esencial para el análisis y el procesamiento de datos adicionales.
Acumula, en un único programa, todo lo necesario para analizar los datos con eficacia.
Las diversas herramientas de medición de datos y de realización de estadísticas se
convierten en imprescindibles para ahorrar tiempo y esfuerzo.
Fue creado por el R Development Team, pero admite la colaboración altruista de
cualquier usuario que quiera ir mejorando el lenguaje con aportaciones.
Destacamos, igualmente, que su uso es habitual en todas las fases del análisis de datos y es de
gran ayuda en:
La elaboración de un informe con los resultados del análisis listo para su uso.
La valoración de los resultados y la puesta en marcha de las medidas que indiquen los
modelos predictivos en comparación con los datos obtenidos en periodos anteriores.
Todas las ventajas anteriores han convertido este lenguaje de programación en uno de los más
usados por los analistas de datos.
Si bien los analistas más experimentados no niegan que es de gran ayuda, también subrayan
sus desventajas, o carencias, principales:
Acumula todos los datos en una única carpeta que termina ocupando demasiado
espacio en una memoria física. Esta circunstancia conlleva que sea necesario volcar los
datos de forma periódica para evitar el colapso de los dispositivos de almacenamiento.
No tiene medidas de seguridad, por lo que es muy fácil de vulnerar por parte de los
ciberdelincuentes. Poner en riesgo la información personal de los clientes de una
empresa puede provocar la toma de medidas legales que terminen generando un serio
problema económico.
Podría afirmarse que el uso de esta alternativa es casi para expertos, pero no es adecuado
olvidar que la capacidad para analizar datos estadísticos es siempre superior a la de otras
opciones. Para dedicarse al análisis de datos es necesario conocer todos los lenguajes de
programación existentes y elegir el que mejor se adapte a los requisitos de cada empresa.
Versión 0.49 (23 de abril de 1997): Es la versión más antigua de la que se conserva el
código (que todavía compila en algunas plataformas UNIX). En esta fecha arrancó
también CRAN con tres espejos que albergaban 12 paquetes. Poco después
aparecieron las versiones alfa para Windows y Mac OS.
Versión 2.11.0 (22 de abril de 2010): Soporte para sistemas Windows de 64 bits.
Versión 2.13.0 (14 de abril de 2011): Añadida una nueva función al compilador que
permite acelerar las funciones convirtiéndolas a byte-code.
Versión 3.4.0 (21 de abril de 2017): El compilador de código de bytes JIT ('Just In Time')
ahora está habilitado en el nivel 3 de forma predeterminada.
R forma parte de un proyecto colaborativo y abierto. Sus usuarios pueden publicar paquetes
que extienden su configuración básica. Existe un repositorio oficial de paquetes cuyo número
superó en otoño de 2009 la cifra de los 2000.
Dado el enorme número de nuevos paquetes, estos se han organizado en vistas (o temas), que
permiten agruparlos según su naturaleza y función. Por ejemplo, hay grupos de paquetes
relacionados con estadística bayesiana, econometría, series temporales, etc.
4.6 REFERENCIAS
https://es.wikipedia.org/wiki/R_%28lenguaje_de_programaci%C3%B3n%29
https://www.maximaformacion.es/blog-dat/que-es-r-software/
https://seactuario.com/ContMatematicas/SOFTWARE_R.pdf
https://keepcoding.io/blog/que-es-el-lenguaje-r/#Caracteristicas_de_R
https://www.unir.net/ingenieria/revista/lenguaje-r-big-data/
https://blogs.imf-formacion.com/blog/tecnologia/