Documentos de Académico
Documentos de Profesional
Documentos de Cultura
LOS GRAFICOS EN R
DE ALTO NIVEL
R dispone de múltiples funciones diseñadas
Estas funciones son las que generan gráficos
para la representación gráfica de datos.
completos. Entre las más utilizadas podemos
Estas funciones se dividen en dos grandes citar plot() (gráficos de nubes de puntos, entre
grupos: funciones gráficas de alto nivel y de otros), hist() (histogramas), barplot() (diagramas
bajo nivel. La diferencia fundamental es que de barras), boxplot() (diagramas de caja y
las funciones de alto nivel son las que bigote), pie() (diagrama de sectores) o pers()
generan gráficos completos, mientras que (superficies en 3D). Todas estas funciones
las de bajo nivel se limitan a añadir disponen de multitud de argumentos que
elementos a un gráfico existente (por tanto permiten controlar las etiquetas de los ejes, sus
límites, títulos, tamaño, colores, etc.:
creado por una función de alto nivel).
Funciones gráficas de bajo
nivel:
Permiten añadir líneas, puntos, etiquetas… a un gráfico ya existente. Son de gran utilidad para completar un
gráfico. Entre estas funciones cabe destacar:
• lines(): Permite añadir lineas (uniendo puntos concretos) a una gráfica ya existente.
• abline(): Añade lineas horizontales, verticales u oblicuas, indicando pendiente y ordenada.
• points(): Permite añadir puntos.
• legend(): Permite añadir una leyenda.
• text(): Añade texto en las posiciones que se indiquen.
• grid(): Añade una malla de fondo.
• title(): permite añadir un título o subtítulo.
Argumentos comunes a las funciones gráficas de alto
y bajo nivel
Los siguientes argumentos opcionales son comunes a muchas funciones gráficas de alto y bajo nivel. Sus valores por defecto pueden obtenerse
ejecutando la función par(). Se puede encontrar el significado y valores posibles de cada uno de estos argumentos (y muchos más) ejecutando
help(par).
• pch: Indica la forma en que se dibujaran los puntos (círculo, cuadrado, estrella, etc). El listado de valores y formas disponibles puede verse
mediante help(points)
• lty: Indica la forma en que se dibujan las líneas (continua, a trazos, …).
• col: Color usado para el gráfico (ya sea para puntos, líneas…). Puede vers un listado completo de los colores disponibles en R ejecutando la
función colors(). help(colors) explica como obtener aún más colores. Este documento contiene una muestra de cada color.
• las: Cambia el estilo de las etiquetas de los ejes (0 paralelo a los ejes, 1 siempre horizontales, 2, perpendiculares a los ejes, 3 siempre verticales)
Ejemplos de funciones gráficas
plot()
Esta función ofrece muchas variantes
dependiendo del tipo de objeto al que se
aplique. El caso más simple corresponde
a la representación de dos variables x e y.
En tal caso, plot(x,y) representa un
diagrama de dispersión de puntos de y
frente a x.
hist()
hist(Happiness,col="darkolivegreen1")
barplot()()
barplot(table(Region),xlab="Region",main=
"Happiness level by region",
col=rainbow(10))
pie()
pie(table(Region))
Funciones de localización e identificación
de puntos:
• Una hipótesis es una decisión que toman los investigadores en base a los datos de la
población recolectados.
• Para realizar la prueba de hipótesis, se toma una muestra aleatoria de datos de la
población y se realiza la prueba. Según los resultados de las pruebas, la hipótesis se
selecciona o se rechaza.
• Para realizar la prueba T en R, se requieren datos distribuidos normalmente. Esta
prueba se usa para probar la media de la muestra con la población. Por ejemplo, la
altura de las personas que viven en un área es diferente o idéntica a la de otras
personas que viven en otras áreas.
Parámetros:
x: representa un vector numérico de datos
• mu: representa el valor verdadero de la media
• Para conocer más parámetros opcionales de t.test() , pruebe el siguiente comando:
ayuda("t.prueba")
EJEMPLO:
# Definición de vector de muestra
x <- norma(100)
# Prueba T de una muestra prueba
t(x, mu = 5)
datos: x
t = -49.504, gl = 99, valor p < 2.2 e-16
hipótesis alternativa: la verdadera media no es igual a 5
Intervalo de confianza del 95 por ciento:
-0.1910645 0.2090349
estimaciones de muestra: media de x 0.008985172
Chi- Cuadrado
Definición: Requerimientos para trabajar con la
distribución de chi-cuadrado:
El estadístico de chi-cuadrado, es útil • La muestra debe ser tomadas al azar
cuando estamos trabajando con • Variables medidas deben ser independientes
variables nominales, categóricas o • Los datos deben ser reportados en frecuencias
estamos trabajando con alguna clase de absolutas (no porcentajes)
clasificación. • Valores / categorías de variables deben ser
mutuamente excluyentes
• Frecuencias observadas no deben pequeñas.