Está en la página 1de 17

Medidas de tendencia central para

datos no agrupados usando R

Alejandro Delgado Amen

Página 1
Contenido
Introducción........................................................................................................................................ 3
Introducción al lenguaje R.................................................................................................................. 4
Instalación de R .................................................................................................................................. 6
Insertar datos...................................................................................................................................... 9
Cálculo de medidas de tendencia central para datos no agrupados usando R. ............................. 12
Código anexo .................................................................................................................................... 16
Bibliografía ........................................................................................................................................ 17

Página 2
Introducción
Introducción

La estadística es la ciencia que se encarga de recolectar, organizar, procesar e interpretar


diferentes tipos observaciones con el fin de deducir las características que presenta una
población, dentro de cada observación podemos encontrar diferentes tipos de variables que
pueden expresar cualidades o diferentes características que se denominan atributos o
categorías y dichas variables son consideradas de orden cualitativo, mientras que las
variables que toman argumentos numéricos se denominan cuantitativas y estas se clasifican
como discretas o continuas, para este caso nos centraremos en las variables de orden
cuantitativo de forma continua.

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un
solo valor a un conjunto de observaciones. Este valor numérico suele estar situado en el
centro de la distribución de los datos. Las medidas de tendencia central más utilizadas
son: media, mediana y moda o también son conocidas como medidas de centralización.

Esta cartilla permite tener una introducción a las medidas de tendencia central para datos no
agrupados aplicando el software estadístico R, los datos son en lo posible elementos de
textos y material de apoyo a la estadística descriptiva, sin embargo, las técnicas estadísticas
son las mismas y con una presentación similar a la que podemos encontrar en cualquier
guía de estadística descriptiva. Por esta razón en la bibliografía se incluyen las referencias
de la estadística y de otros tipos de datos.

Cabe resaltar que se tendrá en cuenta el software R por ser gratuito y carácter contributivo
además se puede ejecutar en una gran variedad de plataformas incluyendo Windows, Linux
y MacOS y proporciona diferentes métodos estadísticos de una manera fácil y sencilla.

Página 3
Introducción al lenguaje R
Introducción al lenguaje R

R es un lenguaje y entorno de programación, creado en 1993 por Ross Ihaka y Robert


Gentleman del Departamento de Estadística de la Universidad de Auckland, cuya
característica principal formar un entorno de análisis estadístico para la manipulación de
datos, su cálculo y la creación de gráficos. En su aspecto R puede considerarse como otra
implementación del lenguaje de programación S, con la particularidad de que es un
software GNU, General Public Licenc (conjunto de programas desarrollados por la Free
Software Foundation), es decir, de uso libre.
La página principal del proyecto “R − project” es http: //www.r − project.org, en ella
podremos conseguir gratuitamente el programa en su última versión, o cualquiera de las
anteriores (para el caso de utilizar paquetes no implementados para las últimas versiones),
además de manuales, librerías o package y demás elementos que forman la gran familia que
es R.
Hay que tener en cuenta R es un proyecto vivo y sus capacidades no coinciden totalmente
con las de S. A menudo el lenguaje S es el vínculo escogido por investigadores que utilizan
la metodología estadística, y R les proporciona una ruta de código abierto para la
participación en esa actividad, los usuarios pueden contribuir al proyecto implementando
cualquiera de ellas, creando modificaciones de datos y funciones, librerías (packages),
Ningún otro programa en la actualidad reúne las condiciones de madurez, cantidad de
recursos y manejabilidad que posee R, además de ser el que en los últimos años ha tenido
una mayor implantación en la comunidad científica.
Entre otras características dispone de:

 Almacenamiento y manipulación de datos.


 Operadores para cálculo sobre variables indexadas (Arrays), en particular matrices.
 Herramientas para análisis de datos.
 Posibilidades gráficas para análisis de datos.
El término entorno lo caracteriza como un sistema completamente diseñado y coherente de
análisis de datos. Como tal es muy dinámico y las diferentes versiones no siempre son
totalmente compatibles con las anteriores. En la introducción a R no se hace mención
explícitamente a la palabra estadística, sin embargo mayoritariamente se utiliza R como un
sistema estadístico, aunque la descripción más precisa sería la de un entorno en el que se
han implementado muchas técnicas estadísticas. Algunas están incluidas en el entorno base
de R y otras se acompañan en forma de bibliotecas (packages).

Página 4
Una diferencia fundamental de la filosofía de R, y también de la de S, con el resto del
software estadístico es el uso del “objetos” (variables, variables indexadas, cadenas de
caracteres, funciones, etc.) como entidad básica. Cualquier expresión evaluada por R se
realiza en una serie de pasos, con unos resultados intermedios que se van almacenando en
objetos, para ser observados o analizados posteriormente, de tal manera que se puede hacer
un análisis sin necesidad de mostrar su resultado inmediatamente produciendo unas salidas
mínimas. (García, 2010)

Página 5
Primeras nociones
Instalación de R

 Página principal de R (si se pone en Google “R”, es la página asociada con “The R
Project for Statistical Computing”):

www.r-project.org/

 En la columna izquierda seleccionamos

Download, Packages

CRAN

 A continuación buscamos, dentro de CRAN Mirrors, el país Colombia

Página 6
https://www.icesi.edu.co/CRAN/

Página 7
 En la sección Download and Install R

Precompiled binary distributions of the base system and contributed packages, Windows
and Mac users most likely want one of these versions of R:

 Linux

 MacOS X

 Windows
Seleccionamos el sistema operativo de nuestro ordenador.

 A continuación, seleccionamos el subdirectorio base

Base Binaries for base distribution (managed by Duncan Murdoch) y descargamos la


versión disponible for Windows (32 o 64 megabytes) Todo lo anterior (si se selecciona el
sistema operativo Windows) se puede hacer accediendo directamente a la página

http://cran.es.r-project.org/bin/windows/base Editor Tinn-R Se puede descargar por


ejemplo de la página http://www.sciviews.org/Tinn-R/ Instalar paquetes Cargar paquetes.

Página 8
Insertar datos
Insertar datos

Para inserta datos se debe nombrar la variable que llevará la información de las
observaciones para lo cual se escribirá en el Scrip de la siguiente manera:

x<-c(2,1,1,3,1,2,5,1,2,3,4,2,3,2,1,4,2,3,2,1)

Otra opción es generar datos aleatorios de la siguiente forma y<-sample (1:20) donde se
indica que se generará los datos aleatorio del al número 20, en otro caso se puede tener una
base de datos almacenada en Excel donde se podrá exportar a R como se muestra a
continuación, Abrir nuestra base de datos a importar y guardarla con el formato CVS
(delimitados por comas) en mis documentos.

Página 9
Ahora para importar la base de datos después de haberla guardado en mis documento en el
formato CVS seguiremos lo siguientes pasos, se le asigna una variable para guardar la
información en ella, para este caso se le asigna la palabra datos y generamos el siguiente
código en el Scrip de la consola del software R.

datos=read.csv("datosinvestigacion.csv", sep=";",dec=",")

datos es el nombre de nuestra base de datos en R, "datosinvestigacion.csv" es el nombre de


archivo guardado en el formato CVS (delimitados por comas), el sep=";" y dec="," son
elementos para organizar la base.

Página
10
Si se desea visualizar la base datos cargada en R, solo es necesario generar el código View
(datos) en el Scrip de la consola de la siguiente manera.

Así se puede establecer la forma de exportar una base de datos a R y poder generar todos
los cálculos que se desean.

Página
11
Cálculo de medidas de tendencia centrar
para datos no agrupados usando R
Cálculo de medidas de tendencia central para datos no agrupados
usando R.

Si se desea saber el número de observaciones que se tiene en nuestra variable x es necesario


generar el código length(x) y nos proporciona el tamaño que tiene nuestro vector, Para el
cálculo de las medidas de tendencia central utilizando el software estadístico R se procede
de la siguiente manera:

Se escribe en el Scrip la palabra summary de la variable x para nuestro caso y se obtendrán


las medidas de tendencia central como la media aritmética y mediana así como se muestra a
continuación.

Min. 1st Qu. Median Mean 3rd Qu. Max.

1.00 1.00 2.00 2.25 3.00 5.00

Para este caso se cuenta con una media aritmética de 2.25 y una mediana 2, como medidas
de tendencia central, como no hay una función estándar para la moda, para ello hay que
cargar la biblioteca “modeest” y usar la función mfv (x).

Página
12
Para este caso se procede seleccionando en la parte superior de la R consola que se
encuentra al lado superior izquierdo de nuestro sofware estadistico R, el comando
packages, el cual nos proporcionará todo los elementos que el sofware tiene a disposición.
Despues de seleccionar el comando mencionado buscamos dentro de las opciones install
package(s).

Ahora nos dirigimos dentro de CRAN Mirrors, al país Colombia el cual será seleccionado
para proceder a cargar nuestro packages

Finalmente buscamos el packages que se desea obtener que en nuestro caso es “modeest” y
damos la orden de aceptar, lo cual genera su instalación de firma inmediata se debe
recordar que para la instalación de cualquier packages se debe contar con servicio de
internet.

Página
13
Después de instalar el packages en nuestra R consola se debe cargar el mismo de la
siguiente manera, se busca en la parte superior el comando packages, y dentro de él se
busca la opción cargar packages.

Despues de haber generado el comando cargar packages se procede a buscar el librería


“modeest” y se le asigna la orden ok, con lo cual se puede realizar el cálculo de nuestra
medida de tendencia central denominada moda.

Página
14
Para dicho cálculo se escribe dentro del Scrip el código mfv(x) que nos permite obtener el
estadístico denominado moda.

Página
15
Código anexo
Código anexo

A continuación se comparten algunos códigos que pueden ser de suma importancia para el
lector

x<-c(2,1,1,3,1,2,5,1,2,3,4,2,3,2,1,4,2,3,2,1) # se crea el vector de observaciones

sort(x) # ordena los valores del vector

order(x) # da la posición ordenada de menor a mayor

sum(x) # suma los valores del vector

cumsum(x) # da la frecuencia acumulada de los datos

length(x) # da la longitud del vector

min(x) # da el menor valor de la distribución

max(x) # da el mayor valor de la distribución

mean(x) # da el promedio de la distribución

median(x) # da la mediana de la distribución

Página
16
Bibliografía

Contreras García José Miguel, M. P. (2010). INTRODUCCION A LA PROGRAMACIÓN.

García, J. M. (2010). INTRODUCCION A LA PROGRAMACIÓN. Recuperado el 10 de 10 de 2017, de


http://www.ugr.es/~batanero/pages/ARTICULOS/libroR.pdf

García-Ligero M. Jesús, R. R. (2010). SIMULACIÓN CON R.

Paradis Emmanuel, A. J. (2003). R para Principiantes.

Santana Julio Sergio, F. E. (2014). El arte de programar en R . México D.F: Instituto Mexicano de
Tecnología del Agua.

Zamora Araya José Andrey, V. B. (2012). Aprendiendo estadística con R. VIII FESTIVAL
INTERNACIONAL DE MATEMÁTICA, 1-9.

Página
17

También podría gustarte